《中国科大团队开发用于原子系统对外部场响应的通用机器学习模型》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-10-29
  • 机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而,可以极大地改变化学结构或反应性的外部场,很少被包含在当前的机器学习模型中。

    中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络(field-induced recursively embedded atom neural network,FIREANN)模型,该模型将伪场矢量依赖特征整合到原子描述符中,以表示具有严格旋转等变性的系统-场相互作用。

    这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相关势能相关联,非常适合在存在电场的情况下对分子和周期系统进行光谱和动力学模拟。特别是对于周期系统,FIREANN 可以通过仅训练原子力来克服极化的内在多值问题。

    该研究以「Universal machine learning for the response of atomistic systems to external fields」为题,于 2023 年 10 月 12 日发布在《Nature Communications》。

    外部场和化学系统之间的相互作用在一系列物理、化学和生物过程中至关重要。通过与原子、分子或凝聚态物质相互作用,外部(主要是电场)可以引起系统的电子/自旋极化和空间取向;它提供了改变化学结构、促进电子转移、控制材料的相变或生物分子的构象转变、巧妙地操纵催化中的化学反应性和选择性以及冷化学反应中的量子动力学的特殊方法。

    精确的场相关量子散射计算仅适用于非常小的系统。基于现代极化理论的密度泛函理论(DFT)和从头算分子动力学(AIMD)模拟已更普遍地应用于研究存在外部电场的更复杂的非周期和周期系统。然而,AIMD 方法的要求仍然非常高,尤其是当核量子效应(NQE)很重要时。

    尽管经验力场可以非常高效,但其准确性受到经验函数和相互作用哈密顿量的近似表达式的限制。例如,常用的偶极子场近似将电场对系统的扰动截断为一阶(即仅包括与永久偶极子的相互作用),并忽略与极化性、超极化性等等。此外,除了这些反作用力场之外,大多数都无法描述键的断裂/形成。

    近年来,机器学习(ML)方法在解决化学高维问题方面取得了革命性的成功。人们已经开发出各种用于准确表示势能面(PES)的机器学习模型。其中一些已扩展到学习张量特性,例如具有正确旋转等变性的偶极矩和极化张量,从而实现电子和振动光谱的高效无场模拟。然而,大多数机器学习模型分别处理势能及其对电场的响应特性,而没有捕获场依赖性。

    在最新的研究中,通过在原子环境的描述中引入简单的场相关特征,中国科学技术大学的研究人员开发了一种场诱导递归嵌入原子神经网络(FIREANN)模型,该模型具有与外部场相互作用的系统的正确旋转等变性。

    在不截断场引起的相互作用的情况下,FIREANN 不仅描述了能量随施加场强和方向的变化,而且还同时描述了(原则上)任何阶数的相关响应属性。基于路径积分的分子动力学 (MD) 模拟与训练有素的 FIREANN 模型可在存在电场的情况下产生代表性分子和凝聚相系统的可靠的从头算光谱。

    该模型的一个显著特征是,它可以通过仅学习原子力来绕开周期系统中极化的多值问题,这是现有机器学习模型中众所周知但很大程度上被忽视的事实。

    该模型使研究人员能够从一次训练中获得所有成分,以对有或没有外部电场的化学系统的光谱和动力学进行建模。NMA分子和液态水的预测振动光谱与无场实验数据之间的良好一致性支持了该模型的有效性。此外,在现场红外或拉曼光谱中可以清楚地预测场诱导的偶极矩排列和共价键的软化。

    特别是对于像液态水这样的周期性系统,系统固有的多值极化导致训练数据中偶极矩不连续,很难用基于原子电荷的传统机器学习模型来表示。在 FIREANN 模型中,通过仅学习原子力,可以很好地绕过这个问题,原子力可以产生场相关势和偶极矩,从而产生液态水的红外光谱。该团队的结果不仅清楚地验证了一体化 FIREANN 模型的高精度,而且还阐明了化学系统和电场之间的相互作用。

    在当前基于原始 PyTorch 框架的实现中,在最完整的场景中训练 FIREANN 模型将比仅强制训练花费 4 倍的时间,因为前一个过程需要样本到样本(高阶)梯度。这个问题可以通过基于新版本 PyTorch 中最近发布的 functorch 模块的改进实现来很大程度上缓解,该模块允许高效计算样本到样本(高阶)梯度。

    需要注意的是,当前版本的 FIREANN 模型仅限于描述均匀外场的影响。在非均匀外场的情况下,电子密度对场的响应是空间相关的,必须明确考虑。

    一种可行的方法是将非均匀场离散化到每个原子中心,并向每个FI-EAD特征引入非等价的场相关函数,以近似每个原子密度对中心原子所经历的局部场的响应。该调整旨在引入与整个系统相互作用的外部非均匀场。这与大约由溶剂环境产生的不均匀电场不同,后者仅作用于嵌入分子中心。

    这些理想的特征使得 FIREANN 方法非常有希望有效地模拟强场诱发的现象,例如电化学、等离子体化学和尖端诱发的催化反应。

  • 原文来源:https://www.nature.com/articles/s41467-023-42148-y
相关报告
  • 《WHOI-NOAA共同开展气候模型的机器学习工具开发》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:liguiju
    • 发布时间:2020-10-29
    • 美国伍兹霍尔海洋研究所(WHOI)最近获得了国家海洋和大气管理局(NOAA)气候观测和监测(COM)项目50万美元的资助,用于开发机器学习工具,以改善对北冰洋和邻近海域海空热交换的预测能力。这些工具将有望填补气候模型在模拟极地冰融化速度方面的空白。 遥感技术的最新进展为研究人员提供了他们所需的数据,以便更好地了解北极冰层融化背后的力量以及海洋与大气之间的热交换的影响。这些实际测量将允许研究人员开发机器学习算法,以验证和改进北极和亚北极地区的卫星建模。 WHOI高级科学家、该项目首席研究员Lisan Yu表示,基于机器学习的框架将提高用于模拟全球气候的海洋表面、冰雪和天气预报的准确性。“北极表面的气温上升速度是世界其他地区的两倍,海冰的退却速度比气候模型模拟预测的快三倍。模型中对北极海冰损失的低估揭示了关于大气、极地海洋和冰覆盖区域之间相互作用的知识方面的重大差距。我们的项目将所有可用的观测结果汇集在一起,以帮助模型做出准确的预测,这对制定有效的气候变化对策至关重要,”Lisan Yu说。 利用伊明格海海洋观测站倡议(OOI)表面浮标、帆布式无人机和卫星上的传感器组合提供的长期、详细的数据,研究人员改进了对高纬度地区海洋和大气之间热交换的模型。 NOAA气候项目办公室COM项目经理Virginia Selz说:“鉴于北极观测数据极为有限,我们需要从中提取尽可能多的信息,以提高NOAA的建模能力。Yu的工作将利用美国在长期原地观测和卫星观测方面的支持,并利用创新的人工智能方法,帮助建模者更好地模拟瞬息万变的北极。该项目在生成增值算法和数据集以改善气候建模方面进一步推进了COM项目工作进展。” 该项目还作为政府机构和实验室、非营利研究机构和私营企业之间的伙伴关系模式,共同应对北冰洋的快速变化。项目合作者包括联合首席研究员Bob Weller等以及NOAA太平洋海洋环境实验室、国家环境预测中心和地球系统研究实验室的研究人员。 (刘雪雁 编译)
  • 《5月14日_华中科技大学等团队利用机器学习方法开发COVID-19患者死亡率预测模型》

    • 来源专题:COVID-19科研动态监测
    • 编译者:xuwenwhlib
    • 发布时间:2020-05-15
    • 信息名称:华中科技大学等团队利用机器学习方法开发COVID-19患者死亡率预测模型 1.时间:2020年5月14日 2.机构或团队:华中科技大学同济医学院、华中科技大学人工智能与自动化学院、卢森堡系统生物医学中心、英国剑桥大学、华中科技大学机械科学与工程学院、华中科技大学无锡研究院、武汉科技大学信息科学与工程学院 3.事件概要: 5月14日,Nature Machine Intelligence发表了题为“An interpretable mortality prediction model for COVID-19 patients”的文章。 COVID-19病例的突然增加给全世界医疗系统带来了巨大压力。当前阶段,疾病严重程度的快速、准确和早期临床评估是至关重要的。为了支持医疗系统的决策和规划,本研究利用中国武汉地区485名感染患者的血样数据,确定了疾病死亡率的关键预测生物标志物。文章中利用机器学习工具选择了三种生物标记物:乳酸脱氢酶(LDH)、淋巴细胞和高敏C反应蛋白(hs-CRP),它们能提前10天以上预测个别患者的死亡率,准确率超过90%。特别是,相对较高水平的乳酸脱氢酶似乎在区分绝大多数需要立即就医的病例方面发挥了关键作用。这一发现与当前医学知识一致,即高乳酸脱氢酶水平与各种疾病(包括肺炎等肺部疾病)中发生的组织破坏有关。总体来说,本文提出了一个简单且可操作的决策规则,可快速预测风险最高的感染患者,从而使他们得到优先安置,并有可能降低死亡率。 4.附件: 原文链接 https://www.nature.com/articles/s42256-020-0180-7