《Nature:人工智能在化学合成中的应用,将合成路线设计速度提高30倍!》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2018-04-13
  • 逆合成分析法是当今有机合成化学的重要手段之一,这种方法揭示了如何将所需分子分解为更简单的化学构建块,然后化学家可以采取必要的反应步骤,用这些简单的结构单元制备所需的分子,用于制造药物和其他产品。然而传统的计算机辅助方式合成速度仍然较慢,且提供的分子质量参差不齐。人类还是需要手动搜索化学反应数据库,来找到制造分子的最佳方法。

    传统逆合成分析法示意图

    为了解决这一问题,Waller教授团队使用蒙特卡洛树搜索(Monte Carlo tree search,MCTS)和与指导搜索的扩展策略网络以及筛选网络相结合,形成了一种新的人工智能算法。来预测那些并未包含在训练数据集中的小分子合成路线。

    研究人员使用2015年之前发布的所有化学反应作为数据,来对这种新型算法进行训练,让这种算法可以自己学习一套“规则”,来预测那些并未包含在训练数据集中的小分子合成路线。

    AI算法探索不同的化学路径

    和两种传统合成方法相比(红色和绿色),使用新型人工智能算法(蓝色)在较短时限内可以完成更多分子的合成路线预测(图片来源:《Nature》)

    研究结果表明,这种新型的算法在单个分子限制时间为5秒钟的情况下,能够对测试集中80%的分子合成路线进行预测。当单个分子用时限制延长至60秒时,新型算法预测分子合成路线的比例达到了92%。这一结果比传统的计算机辅助合成路线设计加快了近30倍。并且在随后进行的双盲测试中,化学家们无法针对同一个分子,对算法预测出的合成路线以及原始文献中的合成路线进行有效区分,从侧面说明了这种新型算法预测的准确性。

    “在过去的60年里,科学家们一直试图通过人工编码的方式,将合成规则指定给计算机,”Waller博士在论文中写道:“和传统方法不同的是,我们使用了具备规划能力、符号象征能力及自动化学习能力的强大算法,这对于计算机能否在化学合成中发挥辅助作用至关重要。而这一技术也为满足人类在农业、医疗及材料科学等领域的需求奠定了坚实的基础。”

    随着人工智能技术的不断发展,其已经开始在化学合成领域发挥强大的作用。我们也希望,未来的人工智能可以在更加多样的科研领域内,实现越来越多的突破。

    原文来自:nature,原文题目为:Planning chemical syntheses with deep neural networks and symbolic AI。

  • 原文来源:http://www.xincailiao.com/news/news_detail.aspx?id=168716
相关报告
  • 《前沿 | AI方法秒出分子设计+合成步骤》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:胡思思
    • 发布时间:2025-04-14
    • 寻找具备研发新药物和新材料所需特性分子的过程既繁琐又昂贵,需要耗费大量计算资源,研究人员往往要花费数月时间,才能在浩如烟海的候选分子中筛选出数量有限的目标分子。 像 ChatGPT 这样的大语言模型有望简化这一流程,然而,让大语言模型像理解句子中的单词那样理解和推理构成分子的原子与化学键却存在技术壁垒。 近期,麻省理工学院和 MIT-IBM 沃森人工智能实验室的研究人员开发出一种颇具前景的方法,利用基于图的模型(Graph-based Model)来增强大语言模型(这些模型专为生成和预测分子结构而设计)。 该方法通过基础大语言模型解析用户自然语言需求后,能在分子设计、原理阐释及合成路线规划等环节智能切换 AI 模块。 它将文本、图形和合成步骤生成交织在一起,把单词、图形和反应整合为一个通用词汇表,供大语言模型使用,实现多模态信息无缝衔接。 与现有的基于大语言模型的方法相比,这种多模态技术生成的分子更符合用户设定的规格,有效合成方案成功率从 5% 提升至 35%。 该方法的效果优于规模比它大 10 倍以上、仅使用文本表示来设计分子和合成路线的大语言模型,这表明多模态融合是新系统成功的关键。 “这有望成为一个‘端到端’的解决方案,能实现分子设计与合成全过程的自动化。如果大语言模型能在几秒钟内给出答案,将为制药公司节省大量时间。”麻省理工学院研究生、该技术论文的合作者 Michael Sun 说道。 这项研究成果将在国际学习表征会议上发表。论文的合作者还包括圣母大学研究生 Gang Liu、麻省理工学院电气工程与计算机科学教授 Wojciech Matusik,以及 MIT-IBM 沃森人工智能实验室资深科学家 Jie Chen。这项研究部分由美国国家科学基金会、海军研究办公室以及 MIT-IBM 沃森人工智能实验室资助。 优势互补 大型语言模型并非为理解化学的微妙之处而设计,这也是它们难以进行逆向分子设计的原因之一。逆向分子设计是指识别具有特定功能或特性的分子结构的过程。 大语言模型将文本转换为一种名为标记的表示形式,用于按顺序预测句子中的下一个单词。但分子是由原子和化学键组成的“图形结构”,不存在特定顺序,这使得它们很难编码为顺序文本。 另一方面,基于图的模型将原子和分子键表示为图形中相互连接的节点和边。尽管这些模型在逆向分子设计中应用广泛,但它们需要复杂的输入,无法理解自然语言,且生成的结果可能难以解释。 麻省理工学院的研究人员将大语言模型与基于图的模型整合到一个统一框架中,实现了优势互补。 Llamole(Large Language Model for Molecule Discovery,分子发现大型语言模型)利用基础大语言模型作为“智能调度员”,理解用户的查询,即用户用通俗语言对具有特定属性分子的需求。 例如,用户在寻找一种分子量为 209、具有特定键特性,且能穿透血脑屏障并抑制 HIV 的分子。 当大语言模型响应用户查询预测文本时,系统会通过独特的“触发令牌”机制,在三大功能模块间智能切换:1、结构生成模块(基于图扩散模型,根据输入条件构建分子骨架);2、语义转换模块(通过图神经网络将分子结构重新编码为大语言模型可理解的词元);3、合成规划模块(根据中间体结构预测反应路径,逆向推导从基础原料到目标分子的完整合成方案)。 “这样做的精妙之处在于模块间的信息闭环,大语言模型在激活特定模块前生成的所有内容,都会输入到该模块中。该模块会以与之前一致的方式进行工作。”Michael Sun 说道,“同样,每个模块的输出都会经过编码,并反馈到大语言模型的生成过程中,这样大语言模型就能了解每个模块的作用,并继续根据这些数据预测标记。” 更优、更简单的分子结构 最终,Llamole 会输出分子结构图像、分子文本描述以及分步合成计划,该计划详细说明了如何合成分子,包括具体的化学反应。 在设计符合用户规格分子的实验中,Llamole 的表现优于 10 种标准大语言模型、4 种微调大语言模型,以及最先进的特定领域方法。同时,它通过生成更高质量的分子,将逆合成规划成功率从 5% 提升至 35%,这意味着这些分子结构更简单,构建模块成本更低。 “大语言模型自身很难确定如何合成分子,因为这需要大量多步骤规划。我们的方法能生成更优且更易合成的分子结构。”Gang Liu 说道。 为了训练和评估 Llamole,研究人员从头构建了两个数据集,因为现有的分子结构数据集细节不足。他们用 AI 生成的自然语言描述和自定义描述模板,对数十万个专利分子进行了扩充。 他们为微调大语言模型构建的数据集包含与 10 种分子特性相关的模板,因此 Llamole 的一个局限在于,它被训练为仅考虑这 10 种数值特性来设计分子。 在未来的研究中,研究人员希望扩展 Llamole 的功能,使其能够考虑任何分子特性。此外,他们还计划改进图形模块,提高 Llamole 的逆合成成功率。 从长远来看,他们希望利用这种方法拓展应用范围,超越分子领域,创建能处理其他图基数据的多模态大语言模型,例如电网中的互连传感器数据或金融市场中的交易数据。 “Llamole 展示了将大型语言模型用作处理文本描述之外复杂数据的接口的可行性,我们预计它们将成为与其他 AI 算法交互以解决各类图形问题的基础。”Jie Chen 说道。
  • 《Nature | 医学人工智能的未来》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2023-10-29
    • 本文内容转载自“ChemBioAI”微信公众号。原文链接: https://mp.weixin.qq.com/s/hlwb9sc0rugxZ_ThiOy7gQ 2023年10月24日,《自然》新闻(Nature News)在线发表了一篇题为An AI revolution is brewing in medicine. What will it look like?的特别报道。 Jordan Perchik于2018年开始在亚拉巴马大学伯明翰分校进行放射科住院医生培训,那时正值他所谓的放射科学领域的“AI恐慌”高峰期。在计算机科学家Geoffrey Hinton宣称人们应停止培训成为放射科医生的仅仅两年后,这一时期开始。Hinton被称为人工智能之父,他预测这些系统很快将能够比人类更好地阅读和解释医学扫描图像和X光片。此后,放射科医学项目的申请数量大幅下降。 基于人工智能的工具越来越多地成为医疗保健的一部分,美国食品和药品监督管理局(FDA)已经授权使用超过500种这类工具。其中大多数与医学影像有关,用于改进图像质量、测量异常或标记检测结果以供后续跟踪。 调查显示,虽然许多医生知道临床AI工具的存在,但实际上只有很小一部分 (大约在10%到30%之间) 使用过它们,他们的态度从谨慎乐观到彻底不信任不等。荷兰乌得勒支大学医疗中心的医学创新实施专家Charisma Hehakaya说:“一些放射科医生对AI应用的质量和安全性存在疑虑。”即使AI工具能够完成它们的目标任务,仍不清楚这是否会转化为患者更好的医疗护理。但有一种被称为综合医学AI的方法似乎正在兴起。这些模型受到庞大数据集的训练,就像驱动ChatGPT和其他AI聊天机器人的模型一样。在吸收大量医学图像和文本数据后,这些模型可以适用于许多任务。尽管目前获得批准的工具执行特定功能,比如在计算机断层扫描(CT)中检测肺结节,但这些综合模型将更像医生,评估扫描中的每一种异常情况,并将其整合为一种诊断。 尽管现在的AI爱好者趋向避免大胆宣称机器将取代医生,但许多人认为,这些模型可以克服目前医学AI的某些限制,有朝一日可能在某些情况下超越医生。然而,这些新工具能够在实际临床护理中使用之前,还有漫长的道路需要走。 目前存在的限制 医学领域的人工智能工具充当从业者的辅助角色,例如通过快速浏览扫描图像并标记医生可能立即查看的潜在问题,这些工具有时表现很出色。Jordan Perchik记得有一次,在他值夜班的时候,一种AI分诊工具在凌晨3点为一名出现呼吸急促症状的患者标记了一张胸部CT扫描。他将这张扫描图像提上优先级,并同意AI的评估结果,该结果显示患者存在肺栓塞,这是一种可能致命且需要立即治疗的情况。如果没有被标记出来,这张扫描图像可能要等到当天晚些时候才会被评估。 但如果AI犯了错误,它也会产生相反的效果。Jordan Perchik说,最近他发现了一例AI没有标记出来的肺栓塞病例,他决定采取额外的审查步骤,最终证实了他的评估,但这减缓了他的工作进度。如果他决定相信AI并继续前进,那么这种情况可能会被漏诊。”许多已获批准的设备并不一定符合医生的需求,早期的AI医学工具是根据影像数据的可用性来开发的,因此一些应用程序是为常见且容易识别的疾病而建立的。 另一个问题是,这些AI工具倾向专注于特定任务,而不是全面解释医学检查——观察图像中可能相关的一切,考虑以前的结果和患者的临床病史。尽管专注于检测一些疾病具有一定价值,但它并不反映放射科医生真正的认知工作。 解决方案通常是增加更多基于AI的工具,但这也对医疗护理构成挑战,伦敦Google Health的临床研究科学家Alan Karthikesalingam表示。假如一个人接受常规乳腺X光检查,技术员可能会采用一种用于乳腺癌筛查的AI工具的辅助。如果发现异常,同一患者可能需要进行磁共振成像(MRI)扫描以确认诊断,而这可能需要另一个AI设备。如果诊断结果得到确认,那么病变将会通过手术移除,可能需要另一种AI系统来协助进行病理学分析。 许多医院并不了解监测AI性能和安全性所涉及的挑战,英国伯明翰大学研究医疗AI负责创新的临床研究员Xiaoxuan Liu表示。她和她的同事们确定了数千份医学成像研究,比较了深度学习模型的诊断性能与医疗保健专业人员的性能。对于该团队评估的69项诊断准确性研究,一个主要发现是,大多数模型未经真正独立于用于训练模型的信息的数据集进行测试。这意味着这些研究可能高估了模型的性能。 坚实的基础 为了解决医学领域AI工具的一些限制,研究人员一直在探索具备更广泛能力的医学人工智能。他们受到了像ChatGPT这样的革命性大型语言模型的启发。这个术语是由斯坦福大学的科学家们在2021年创造的,它描述了在广泛的数据集上进行训练的模型,这些数据集可以包括图像、文本和其他数据,使用一种称为自监督学习的方法。这些基础模型,也被称为基本模型或预训练模型,构成了后续可以适应执行不同任务的基础。 目前大多数医学AI设备是通过监督学习方法开发的。例如,使用这种方法训练一个模型来识别肺炎,需要专家分析大量的胸部X光片并将它们标记为“肺炎”或“非肺炎”,以教导系统识别与该疾病相关的模式。在基础模型中不需要大量图像的注释。例如,对于ChatGPT,使用大量文本进行训练,以训练一个通过预测句子中的下一个单词来学习的语言模型。同样,伦敦摩尔菲尔德眼科医院的眼科医生Pearse Keane及其同事开发的医学基础模型使用了160万张视网膜照片和扫描图像,以学习如何预测这些图像缺失部分应该是什么样子。在进行了这一预训练后,研究人员引入了几百张标记图像,使其能够学习特定的与视觉相关的疾病,如糖尿病性视网膜病变和青光眼。该系统在检测这些眼部疾病以及通过眼底血管微小变化检测出的心脏病和帕金森病等系统性疾病方面优于以前的模型,但该模型尚未在临床环境中进行测试。 Keane表示,基础模型对眼科学领域特别合适,因为几乎可以对眼部的每个部位进行高分辨率成像。而且有大量的这些图像数据可用于训练这种模型。人工智能将彻底改变医疗保健,而眼科学可以成为其他医学专业的示范。大型科技公司已经在投资使用多种图像类型的医学成像基础模型,包括皮肤照片、视网膜扫描、X光片和病理学切片,并整合电子健康记录和基因组数据。 今年6月,Google Research科学家们发表了一篇论文,介绍了他们称之为REMEDIS(具有自监督的强大和高效医学成像)的方法,与使用监督学习训练的AI工具相比,该方法能够将诊断准确性提高高达11.5%。研究发现,在对未标记图像的大型数据集进行预训练后,只需要少量标记图像就能达到这些结果。这项研究的共同作者之一,Karthikesalingam说:“我们的主要发现是,REMEDIS能够以非常高效的方式,只需很少的示例,学会如何在许多不同的医学图像中对许多不同的事物进行分类,包括胸部X光片、数字病理学扫描和乳腺X光检查。”次月,Google的研究人员在一篇预印本中描述了他们如何将这一方法与该公司的医学大型语言模型Med-PaLM相结合,该模型几乎可以像医生一样回答一些开放性的医学问题。结果表明,Med-PaLM Multimodal不仅可以解释胸部X光图像,还可以以自然语言起草医疗报告。 微软也在努力将语言和视觉整合到一个单一的医学AI工具中。今年6月,公司的科学家们推出了LLaVA-Med(生物医学大型语言和视觉助手),该模型在与从PubMed Central(一个公开可访问的生物医学文章数据库)提取的文本配对的图像上进行训练。微软Health Futures的生物医学AI研究负责人Hoifung Poon表示:“一旦你这样做,你就可以开始与图像进行对话,就像你在与ChatGPT交谈一样。” 这种方法的一个挑战是它需要大量的文本-图像对。 随着这些模型在越来越多的数据上进行训练,一些科学家乐观地认为它们可能能够识别人类无法识别的模式。AI工具可能在某些领域超越人类能力,比如使用数字病理学来预测免疫疗法对肿瘤的反应。 Karthikesalingam还指出,即使Google的医学成像AI取得了最佳结果,它仍然无法与人类相媲美。人类放射科医生的X光报告仍然被认为明显优于最先进的多模式综合医学系统。尽管基础模型似乎特别适合扩大医学AI工具的应用,但要展示它们可以安全用于临床护理还有很长的路要走。 毫无疑问,AI在放射科领域的作用将继续增长,与其说取代放射科医生,不如培训他们如何使用AI。