《中科大江俊团队自主研发Chem-GPT,改变传统化学研究范式,解放化学家双手》

  • 来源专题:数智化图书情报
  • 编译者: 黄雨馨
  • 发布时间:2023-07-11
  • 近日,中国科学技术大学化学与材料科学学院江俊团队自主研发 Chem-GPT——一款化学领域的聊天机器人程序。

    Chem-GPT 由化学数据驱动,并结合人类化学家的知识进行机器学习训练,能够针对使用者提出的问题,给出初步的实验建议。基于开源的 GPT 代码,目前阅读了 50 万化学论文,可以基于论文知识来回答化学问题、建议实验方案,驱动机器化学家「小来」做实验,解决化学品和新材料的研发问题。


    Chem-GPT 通过阅读 50 万篇化学论文,响应使用者提出的化学问题。

    1. 大胆假设:基于文献数据,给出初步实验建议;

    2. 小心求证:驱动机器化学家「小来」做实验与模拟;

    3. 精准预测:针对实验与理论数据归纳总结;

    4. 解决问题反馈优化方案驱动实验验证。,时长02:33以芬顿催化剂为例Fenton(芬顿)是众多的以人名命名的无机化学反应之一。

    芬顿反应是一种无机化学反应,过程是过氧化氢(H2O2) 与二价铁离子 Fe2+ 的混合溶液将很多已知的有机化合物如羧酸、醇、酯类氧化为无机态。反应具有去除难降解有机污染物的高能力,在印染废水、含油废水、含酚废水、焦化废水、含硝基苯废水、二苯胺废水等废水处理中有很广泛的应用。

    芬顿催化剂又叫芬顿催化氧化填料,芬顿填料,它在传统芬顿反应的基础上,将芬顿反应所需的铁氧化物通过特殊方法附着在载体表面,形成有效的芬顿催化剂。

    问:什么类型的非贵金属元素常用于芬顿催化剂?

    Chem-GPT 的结果其实就来自于江俊团队开发的化学文献机器阅读系统,该系统内置了自然语言处理模型,通过阅读数千篇芬顿催化剂相关文献,可以很快统计出文献中出现频次最多的非贵金属元素。

    化学文献机器阅读系统。文献中出现频次最多的非贵金属元素。除了对数量进行统计,该系统还能进行元素协同分析来帮助我们选择最佳的元素组合。


    最佳的元素组合。

    Chem-GPT 能从文献的精确分析中学习到正确的知识,并不是仅仅基于语言的关联性,因此它给出的答案保证了严谨与准确性。

    接下来,就可以调出机器化学家操作系统中保存的芬顿催化剂实验模板,并根据 Chem-GPT 推荐的元素组合编辑液体进样站的参数,让机器获取家小来帮助我们进行实验验证。


    就这样,小来开始了愉快的芬顿催化剂创制之旅。化学文献机器阅读系统化学文献机器阅读系统基于 Word2Vec 与机器学习算法,结合语法距离分析方法,根据关键词,从文献中抽取化学关系,包括 Alloy 和 Organic molecule 两种任务。程序使用说明如下:

    1. 数据准备:目前系统支持两种格式数据:一是 TSV 文件格式,需要从 Web of Science 网站上下载,方法如下:进入 Web of Science 网站,根据关键词检索文献后,以制表符分隔符的形式导出,具体步骤见下图所示。




    二是 PDF 格式文件格式,支持任意 PDF 格式论文。

    2. 数据准备完成后,点击页面新建任务按钮,进入新建任务页面;

    3. 在新建任务页中填写任务名称、抽取的分子类型、上传准备的数据、填写关键词信息,其中点击可添加多个关键字; 当抽取的任务类型为 ALLOY 时,需指定目标元素在元素周期表上的周期,当需抽取的任务类型为有机分子, 则无需选择。

    4. 填写完成后,提交任务,等待任务排队完成,即可获取最终化学关系抽取结果。机器化学家2021 年 6 月,在 2021 北京智源大会《科学智能》专题论坛上。中国科学技术大学化学物理系江俊教授作了题为「分子光谱与材料构效关系的机器学习研究」的演讲。

    江俊表示:「上个月,中国科学技术大学研究人员提出「机器化学家」这个概念。我从鄂维南院士提出的『AI for Science——从理论模型得到可靠的数据,再从数据得到有效的模型』得到了启示,修改了我之前的思路,并拿到了项目。」「机器化学家」将帮助人类科学家突破思维局限,从融合了底层规则的数据中,学习建立有效的复杂模型,指导化学实践。

    就在项目启动一年后,在中国科学院「数据驱动的化学、材料和生物科学的机器科学家」青年团队计划和国家自然科学基金委项目的资助下,江俊教授团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,研制出数据智能驱动的全流程机器化学家。,时长02:02这个神奇的「机器化学家」是全球首个数据智能驱动的全流程机器化学家平台。

    当然,「机器化学家」并只是一年就可以完成的,这是中国科学技术大学化学与材料科学学院教授罗毅、江俊团队经过八年攻关研制出的。

    相关研究成果以「An all-round AI-Chemist with a scientific mind」为题,于 2022 年 9 月发表在《国家科学评论》(Natl.Sci.Rev.)上。

    论文链接:https://academic.oup.com/nsr/article/9/10/nwac190/6694008「机器化学家」由「化学大脑」、机器人实验员和智能化学工作站三部分组成。其中最核心的「化学大脑」通过分析大量化学实验和理论数据建立知识图谱,实现了阅读理解文献、设计化学实验、自主优化方案的能力,并配备了人机交互的操作系统,可以便于「无编程基础」的科研用户使用。机器人实验员和 16 个化学工作站之间能进行数据交换和互动,精准配合执行化学实验。

    业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出「最强化学大脑」指导的智能新范式的巨大优势,引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。

    全球首个数据智能驱动的全流程机器化学家。就在本月,江俊团队首次将数据驱动自动合成、机器人辅助可控合成、机器学习促进逆向设计,用于胶体纳米晶(例如钙钛矿)材料合成,探索构建了「机器科学家」平台,有望将科研人员从传统试错实验、劳动密集型表征中解放,聚焦科学创新,实现纳米晶材料数字智造。

    该研究以「A robotic platform for the synthesis of colloidal nanocrystals」为题,于 2023 年 3 月 2 日发布在《自然-合成》(Nature Synthesis)上。

    论文链接:https://www.nature.com/articles/s44160-023-00250-5「这主要得益于中国科大多学科交叉的背景,促使不同学科的科研人员汇集在一起共同做一件事。我们的目标是建成机器化学家大科学装置,解放化学家双手,加快新的化学品和新的材料研发创制。」江俊教授说。

    未来蓝图:改变传统化学研究范式,解放化学家双手

    对于未来,江俊教授希望他们可以建成一个「机器化学家」大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。一边,全国的化学家、材料学家只需在网上提交自己的任务;另一边,团队成员通过智能操作系统分时安排机器人完成任务,最后将方案反馈给化学家们。

    基于这样一个大平台,各个课题组的实验数据可以交汇、共享,产生海量数据,实现自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化产生更好、更高效率的化学品或新材料。而且在完成各个实验过程中,机器人通过与科研人员互动,默默学习人类的操作逻辑、思维模式,很有可能在若干年之后,机器人会变成一个智能、创造力都比肩大学教授的机器化学家。

    「我们希望争取到国家的支持,在 2 至 3 年内建成拥有几十台机器人的小型装置,3 至 5 年后建成一个大科学装置。在这期间,我们还需要不断训练机器人和智能化学通用模型。」江俊教授规划着未来的研究蓝图。他们最终目标是改变传统化学研究范式,解放化学家双手。

  • 原文来源:https://mp.weixin.qq.com/s/EBww_RmOpu2xckspVZ_ZbQ
相关报告
  • 《“人工化学家”结合人工智能、机器人技术进行自主研发》

    • 来源专题:纳米科技
    • 编译者:郭文姣
    • 发布时间:2020-06-08
    • 来自北卡罗莱纳州立大学和布法罗大学的研究人员开发了一项名为“人工化学家”的技术,该技术结合了人工智能(AI)和执行化学反应的自动化系统,以加速研发和生产商业所需材料。 在概念验证实验中,研究人员证明,人工化学家可以在15分钟或更少的时间内识别并生成任何颜色的可能的最佳量子点。量子点是胶体半导体纳米晶体,用于LED显示屏等应用。 然而,研究人员很快指出,人工化学家可以识别出满足任何可测量属性的最佳材料——而不仅仅是量子点。 “人工化学家是一个真正自主的系统,可以智能地在化学宇宙中导航,”米拉德·阿博尔哈萨尼说,他是一篇关于这项工作的论文的通讯作者,也是北卡罗来纳州化学和生物分子工程学的助理教授。目前,人工化学是为溶液处理材料设计的,这意味着它适用于那些可以使用液体化学前体制造的材料。溶液处理材料包括量子点、金属/金属氧化物纳米颗粒、金属有机骨架(MOFs)等高价值材料。 “人工化学家类似于自动驾驶汽车,但自动驾驶汽车至少有有限的路线可供选择,以便到达预先选定的目的地。对于人工化学家,你给它一组所需的参数,这些参数是你希望最终材料具有的属性。人工化学家必须弄清楚其他的一切,比如化学前体是什么以及合成路线是什么,同时尽量减少这些化学前体的消耗。 “最终的结果是一种完全自主的材料开发技术,它不仅能帮助你比目前使用的任何技术更快地找到理想的解决方案处理过的材料,而且还能使用少量的化学前体。”这大大减少了浪费,也大大降低了材料开发过程的成本。” 这位人工化学家不仅有一个执行实验并感知实验结果的“身体”,还有一个记录数据并利用它来决定下一个实验是什么的“大脑”。 为了进行概念验证测试,Artificial Chemist的身体整合了Abolhasani实验室开发的自动化纳米晶体工厂和纳米流体合成平台。人工化学家平台已经证明它每天可以运行500个量子点合成实验,尽管Abolhasani估计它可以运行1000个。 人工化学家的大脑是一个人工智能程序,它描述身体正在合成的材料,并利用这些数据对下一组实验条件做出自主决定。它的决定是基于它所决定的将最有效地使它朝着具有期望性能和性能指标的最佳材料组成的方向前进。 “我们试图模仿人类做决定的过程,但更有效率,”Abolhasani说。 例如,人工化学家允许“知识转移”,这意味着它存储从它收到的每个请求生成的数据,加快识别下一个候选材料的过程。换句话说,随着时间的推移,人工化学家在识别正确的物质方面变得越来越聪明和快速。 为了证明他们的概念,研究人员测试了人工智能如何使用数据来决定下一个实验是什么。然后,他们进行了一系列的请求,每次都要求人工化学家识别出最适合三个不同输出参数的量子点材料。 “我们发现了一种政策,即使没有先验知识,也能在25个实验或大约一个半小时内识别出最好的量子点,”Abolhasani说。但一旦人工化学家有了先验知识——这意味着它已经处理了一个或多个目标材料请求——它就能在10到15分钟内确定具有新特性的最佳材料。 “我们发现,人工化学家还可以快速识别给定一组起始化学前体的材料性质边界,这样化学家和材料科学家就不需要浪费时间探索不同的合成条件。 “我相信由人工化学家实现的自主材料研发可以重塑材料开发和制造的未来,”Abolhasani说。“我现在正在寻找合作伙伴,帮助我们将这项技术从实验室转移到工业部门。”
  • 《化学家发明能改变太阳能储存的技术》

    • 来源专题:可再生能源
    • 编译者:董璐
    • 发布时间:2015-08-17
    • 化学家已经开发出能够捕捉和留住来自太阳光能量的一重大改进,其中存储的能量比目前的太阳能技术的持续时间可以大大延长——长达数周,而不是如今的屋顶太阳能电池板持续微妙的时间。日期:7.15 2015   来源:加州大学洛杉矶分校