解决当今最复杂的科学挑战往往意味着追踪数百、数千甚至数百万个变量之间的联系。科学数据集越大,这些联系就变得越复杂。
随着时间的推移,实验会产生PB甚至EB的数据,追踪药物发现、材料开发或网络安全等过程中的联系可能是一项艰巨的任务。
值得庆幸的是,随着人工智能的出现,研究人员可以依靠图神经网络(GNN)来绘制连接图并解开它们的关系,大大加快了解决问题的时间,进而加快了科学发现的速度。
能源部橡树岭和劳伦斯伯克利国家实验室(ORNL和LBNL)的研究人员正在开发GNN,以扩展国家最强大的计算资源,这是应对当今以数据为中心的科学挑战的必要步骤。
ORNL的Massimiliano“Max”Lupo Pasini、Jong Youl Choi和Pei Zhang在2023年11月27日至30日举行的2023年图形学习会议上分享了多机构团队的发现。他们的教程“使用HPC和超级计算设施的可扩展图神经网络训练”说明了如何在DOE的领导级计算系统上扩展GNN。
具体而言,该团队在LBNL国家能源研究科学计算中心的Perlmutter系统以及橡树岭领导力计算设施的Summit和Frontier超级计算机上演示了HydraGNN的扩展。Frontier是世界上第一个exascale系统,目前被列为世界上最强大的计算机。
HydraGNN是GNN架构的ORNL品牌实现,旨在快速准确地预测材料特性。它通过将固体材料的晶格结构抽象为图来使用原子信息,其中原子由节点表示,金属键由边表示。这种表示自然地包含了关于材料结构的信息,消除了更传统的神经网络所需的计算成本高昂的数据预处理的需要。
“科学进步需要发现和设计具有改进的机械和热力学性能的材料,HydraGNN是一个很有前途的替代模型。一旦根据大量的第一性原理数据进行训练,该模型就可以以最先进的基于物理的模型所需计算时间的一小部分提供对材料性能的快速准确估计,”他说Pasini,ORNL计算科学与工程部研究员。“HydraGNN产生预测的速度提高,为有效的材料发现和设计提供了独特的探索能力。”
该团队的教程分为五个部分。第一个强调了科学应用,这些应用激励了可扩展GNN代理模型的开发,以加速复杂物理和工程系统的研究。第二个介绍了在DOE领导级超级计算设施上使用大量科学数据来扩展GNN的必要性。第三个涵盖了HydraGNN的可扩展性和灵活性,这使其能够在多个DOE系统中进行移植。第四节介绍了在开源数据集上运行HydraGNN的示例,第五节也是最后一节包括教程和结束语。
HydraGNN的改进能力最近也记录在用户手册中,该手册已通过ORNL技术报告向公众发布。
这项研究是ORNL人工智能倡议的一部分,该倡议是一项内部投资,致力于确保人工智能安全、可信和节能,为科学研究和国家安全服务。通过该倡议,ORNL的研究人员利用实验室的计算基础设施和软件能力,加快解决方案的速度,并在具有国家和国际重要性的项目中实现人工智能的潜力。
例如,该倡议帮助多学科团队证明,机器学习算法可以用于从低信噪比的信号中提取信息,开发能够在几乎没有训练数据的情况下加速建模和模拟的算法,并设计能够检测癫痫发作的新型仿生神经形态设备。
ORNL人工智能计划主任Prasanna Balaprakash表示:“比例图神经网络带来了独特的挑战。”。“这些模型能够在广泛的科学数据集上进行训练,开启了广泛的下游应用,特别是在新材料开发和药物发现方面。这一成就突显了我们致力于开发不仅强大,而且节能和可扩展的人工智能,确保我们保持在科学研究和国家安全的最前沿。”