《广州超算卢宇彤团队推材料计算新模型》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心—领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2022-10-17
  • 国家超算广州中心卢宇彤教授团队基于“HPC+AI”双驱动的方法,依托“天河二号”超级计算机,构建了国内实验结构最多、元素分布最广、大体系结构最多的第一性原理计算数据库,并开发了准确、快速且高泛化性的人工智能模型,突破了传统第一性原理方法计算耗时长且模拟体系有限的瓶颈,有望助推材料科学、物理学、化学、生物学等学科新发现。相关研究成果“Improving Material Property Prediction by Leveraging the Large-Scale Computational Database and Deep Learning”已在国际期刊Journal of Physical Chemistry C上发表,并被选为封面文章。

    近年来,在计算科学的推动下,基于密度泛函理论(DFT)的第一性原理计算取得了巨大进展,已成为物理学、材料科学、化学等研究不可或缺的一部分。但随着DFT计算精度的提高,计算耗时急剧增加且其计算体系规模有限。基于数据驱动的人工智能方法可有效缩短计算时间,但由于缺乏大规模高质量数据支撑,导致模型精度不高、泛化能力弱且通用性低。为应对这一挑战,卢宇彤团队依托“HPC+AI”范式,基于“天河二号”构建了大规模第一性原理计算数据库,并开发了面向晶体材料的增强节点和边消息交互传递的新型图神经网络算法,打造了高精度的材料性能预测模型。

    以无机晶体材料为例,研究团队构建了近10万个晶体结构数据库,并对这些数据进行了大规模高通量DFT计算,最终获得了这些结构的电子结构、费米能、形成能、磁性、力学以及几何结构等近百万条物性数据,为材料、化学、物理等领域的相关研究奠定了基础。目前,所有数据已发布在广州超算自主研发的新材料设计平台Matgen,供材料设计领域人士访问、借鉴与使用。

    据了解,Matgen数据库在材料结构数目、元素分布和多样性、包含结构原子大小分布等方面均优于国际知名数据库,且其准确性与采用同样泛函精度的MP和OQMD数据库近似。据介绍,广州超算精心构建的Matgen数据库已成为“国内实验结构最多、元素分布最多样、大体系结构最多的DFT计算数据库”。

    为保持精度,DFT的计算成本很高。因此,借助AI技术对DFT数据进行非线性拟合,是使用材料结构进行性能预测的研究热点。研究团队着力开发了基于有向图的深度学习模型CrystalNet,并且利用Matgen数据库来进行训练。对比试验表明,CrystalNet的带隙预测准确性优于当前主流的MEGNet和CGCNN模型。

    为进一步提高模型预测精度,解决传统DFT中PBE泛函对于带隙值低估的问题,团队采用迁移学习的方法,基于实验带隙数据对模型进行调优。结果表明,迁移学习模型CrystalNet-TL能有效改善带隙值被低估的问题,预测性能得到进一步提升。同时,研究团队从公开数据库中收集了部分虚拟晶体结构数据,进一步验证CrystalNet-TL模型在虚拟材料(即潜在新材料)性质预测上的泛化能力。

    作为推动科学研究的新范式,“HPC+AI for Science”被认为可推动高性能计算和人工智能等新技术的融合,加速科学发现的步伐,有望为自然科学带来变革性的影响。据研究团队介绍,广州超算自主研发了集高性能计算、大数据以及人工智能为一体的融合系统,面向科学应用领域建立了软硬件协同的超算生态环境,取得了诸多创新应用成果。该融合系统也是近年来相关领域的首次报道。

相关报告
  • 《AI新模型快速预测材料光学性质》

    • 来源专题:光电信息技术
    • 编译者:王靖娴
    • 发布时间:2024-10-14
    • 【内容概述】据美国趣味工程网站近日报道,日本东北大学和美国麻省理工学院科学家,成功开发出一款新人工智能(AI)模型GNNOpt。该模型能以与量子模拟相同的精度预测材料的光学性质,但速度能快100万倍。研究团队表示,这一重要进展有望加速光伏和量子材料的研发步伐。   新AI模型另辟蹊径,以材料的晶体结构为输入,能在极短时间内,以惊人的准确性,在更宽的光频率范围内预测材料的光学特性。一旦科学家掌握某种光学性质,就可借助相关公式,推导出其他光学性质。新AI模型成功的秘诀在于“集成嵌入”技术。这项技术赋予了AI从多种数据集中学习的能力,使其变得更加精确且通用。   研究团队称,他们的新AI模型能够准确预测晶体结构的光学性质,为广泛应用打开了大门,特别是为先进太阳能电池和量子材料的筛选提供了强有力的支持。他们计划创建包含各种材料特性(如力学和磁性)的综合数据库,以进一步扩展该AI模型的功能。
  • 《机器学习模型为预测材料属性和结构助力》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-06-11
    • Robert Rudd,Timofey Frolov和Amit Samanta三人站在模拟C2H4分子的拓扑原子的模型前面,该模型由分子中的原子量子论(QTAIM)定义并通过TopoMS计算得到,每种颜色代表一个原子。来源:劳伦斯利弗莫尔国家实验室 利用机器学习,演化算法和其他先进的计算技术,劳伦斯利弗莫尔国家实验室(LLNL)的研究人员成功地模拟了构成大多数材料的晶体之间的原子排列方式,这一发展可能对未来材料的设计和优化方式产生影响。 尽管大多数材料在肉眼看来可能是均匀的固体,但它们实际上是由微小的晶粒或颗粒组成,它们之间在原子水平上存在着界面,科学家称之为晶界。晶界对于材料特性和功能十分重要,因此这些晶界的结构已被广泛研究。然而,通过手工搜索数十亿种可能的结构,并试图预测它们的行为无异于大海捞针。 LLNL、内华达大学、拉斯维加斯大学,石溪大学和加州大学戴维斯分校的研究人员已经设计了一种基于先进算法和机器学习的方法,能够通过梳理晶界中原子的排列方式,并预测它们将如何在一定条件下相互作用。科学家表示,该方法最终提供了一种预测材料性能的方法,未来可能在开发具有更高强度,更高耐热性或更高导电性的材料方面取得重大突破。这篇论文今年早些时候在菲尼克斯召开的金属和材料学会2018年国际会议上发表。 该项目首席研究员LLNL科学家Timofey Frolov说:“我们开发的第一种计算工具能够有效地采样晶界的可能结构,并找到对应的低能量结构以及重要的亚稳态。令人惊喜和震惊的是,我们自认为已经理解了晶界的结构,但实际上没有。事实上,我们正在从头开始,因为我们所看到的许多晶界结构与我们之前的想法不一样。” 科学家说:“晶界的原子构成是材料在某些条件,如强热或极压条件下,如何表现或改变相位(即固态为液态)的基础。使用机器学习可以探索可能的结构并能够以计算方式对它们进行建模,这可能会对设计用于各种能源应用的材料产生重大影响,这些应用包括固态燃料电池,用于发电的热电,氧传感器,光纤,开关,激光器放大器和镜头等。” “近年来,机器学习发生了一场革命,从而获得以前无法获得的东西,而以前对晶界结构的研究却给出了不正确的结果,那么就需要这些现代技术的力量来找到正确的答案。”LLNL计算材料科学组组长Robert Rudd说。“近几十年来我们所看到的很多技术变革都是通过以前不存在的材料实现的,因此,为这些结构启用和优化设计将会改变游戏规则。” 研究人员使用铜材料创建并表征了新模型,并成功地用硅,钨和其他材料对其进行了演示和测试。LLNL的聚变能源计划中也已经实施。Frolov表示,他希望进一步开发具有多种元素的系统功能陶瓷的方法,该方法会在高温下显示出迷人和复杂的转变。 “最近大量的实验研究表明,掺杂后陶瓷材料的晶粒生长行为发生了巨大的变化,并且将这些变化与晶界处的结构转变联系起来,”Frolev说。“例如,异常大尺寸晶粒的形成可以彻底改变材料的性质,但难以预测或控制。我们的新方法首先可以提供晶界转变的证据,也可以预测晶界的不同状态,并解释实验中看到材料性质产生突然变化的原因。” 原文来自phys网站,原文题目为Machine learning model predicts phenomenon key to understanding material properties,