《为实验科学家量身打造的“钢铁侠贾维斯”智能助手》

  • 来源专题:先进材料
  • 编译者: 李丹
  • 发布时间:2023-11-12
  • 来自材料牛

    【成果导读】

    人工智能以及自主实验室目前主要由Python等语言编写,但并非所有实验科学工作者都擅长这类编程语言,因此其在真实世界实验中的影响力还是比较有限。然而,基于OpenAI 最近发布的ChatGPT API函数调用功能,打造一个曾经只能在钢铁侠电影中看到的贾维斯智能助手现已成为了可能。近日,MIT李巨教授组开发了一个实验科学家的人工智能助手CRESt(Copilot for Real-world Experimental Scientist),其后端是用ChatGPT作为核心串联起①真实世界的机械臂进行自动化实验,②本地或网上专业的材料数据库,③优化材料配方的主动学习算法。前端已经实现了voice-in voice-out,AI生成语音,以及多平台无缝切换。有了CRESt之后,即使没有任何代码经验,科研工作者都能通过与其口头对话来利用自动化实验平台帮自己做实验。

    相关成果以“CRESt – Copilot for Real-world Experimental Scientist”为题上传于预印本平台ChemRxiv。


    核心创新点】

    CRESt“操作系统”主要由四部分组成:用户界面,ChatGPT后端,主动学习和末端执行器。用户界面基于chatgpt-voice,一个支持语音转文本和文本转语音交互的Github项目。其便捷的网络框架使得用户可以在离开实验室后在他们的手机上无缝地继续对话——因为后端是独立运行的,即使前端改变也不会受到影响。此外,作者还将可以实时生成非常逼真的人声的ElevenLabs AI语音集成到了前端中。

    从前端收到的文本消息随后将被传输到建立在CallingGPT基础之上的ChatGPT后端。CallingGPT是另一个Github项目,其能将Google docstring样式记录的Python函数转换成ChatGPT API可以识别的JSON格式,以供在ChatGPT认为需要时调用。此外,它在ChatGPT和本地Python函数库之间闭合了一个反馈回路:ChatGPT所建议调用的函数将立即在本地执行,并且其返回值将被发送回ChatGPT。

    除此之外,作者还在CRESt中嵌入了主动学习算法。得益于在小数据集上不错的性能,主动学习被认为是最适合实验科学的机器学习算法之一。在涉及真实物理世界实验的机器学习项目中,数据采集往往是最大的挑战。与虚拟世界不同,真实物理世界中的每一个数据点可能都需要花费大量的时间和金钱。一般来说,一个1000个点的数据集就已经是相当不错的了。在这样的条件下,如何对设计空间进行高效取样变得至关重要。主动学习的主要功能是交互式地建议在下一批实验中测试的参数组合,比如在视频中展示的合金配方推荐。在CRESt中内嵌的是由Meta团队开发的基于BoTorch的Ax平台。Ax有着优秀的SQL存储功能:即使GPT后端重置,也可以通过调取数据库中存储的记录来继续之前的主动学习。

    末端执行器是一系列通过HTTP请求调用的子程序。其中一些可能涉及信息检索任务(本地或公共数据库查询,如Materials Project),而其他一些可能会对物理世界产生真实的影响,就像在视频中展示的那样(液体处理机器人、激光切割机、泵、气阀、机械臂等),主要是用于做实验的一些自动化的硬件。这些设备的自动化主要由PyAutoGUI实现,一个可以模拟人类鼠标和键盘动作的Python库。然而,作者预期这个冗余步骤最终将失去其必要性,因为在不久的将来大多数实验室设备都应该会在人类交互界面之外提供一个专用的AI通信接口。

    【成果启示】

    大语言模型可以为科学和工程领域带来什么?这是作者团队自ChatGPT问世以来一直在思考的问题。毫无疑问,大语言模型已经展示了其作为文献整理员的超凡潜力,我们需要做的只是在预训练过程中向其提供更多的文献全文。除此之外还有哪些可能性呢?除了我们以CRESt形式开发的实验员助手的角色,我们设想大语言模型至少还会在以下三个维度发挥革命性的作用:

    仪器技术指导员。目前,研究人员必须理解他们希望利用的任何技术的理论基础,以及个别仪器的具体操作(有时是基于经验的“技巧”、“手艺”),而这些操作可能会因制造商而异。后者往往意味着不可忽视的时间成本,例如一个公共仪器的一系列培训课程,或者阅读一个组内仪器的200页说明书,以及上百小时的实操练习。但我们冷静下来思考一下,这些步骤真的是必要的吗?我们预见,在不久的将来,研究人员只需要清楚地用自然语言表达他们的需求,大语言模型就能够将这些需求翻译成最佳的参数设置(其实这就是现在一些仪器专家正在做的事情,了解客户的需求,并转化成仪器参数设定/操作)。当必要时,大语言模型也可以将说明书中的对应部分提供给用户以便用户了解详情。从技术上来说,仪器制造商只需要适当地微调一个大语言基础模型,让其学习公司内高级技术员所掌握的仪器操作经验即可,这件事从今天就能开始做。

    流水线诊断师。结合了多传感器的机器人或无人机后,大语言模型可以帮助确定实验可重复性不佳的根本原因。在未来,最理想的实验范式是记录每个样品整个生命周期中的所有元数据。当出现无法解释的现象时,所有相关的日志数据都将被输入到多模态大语言模型进行分析。利用其优秀的假说生成能力,大语言模型可以提出一系列潜在的原因,以供人类专家进一步调查他们认为最有可能的几个假说。这种方法也可以应用于工业流水线——如果注意到生产产量/良品率大幅下降,大语言模型可以通过对比流水线历史记录来识别"罪魁祸首"。只有需要复杂的现实世界操作时,人类工程师才需要介入,除此以外大语言模型可以直接对大概率出了问题的子环节进行参数微调。实现这个角色的前提条件是大语言模型可以处理大量的图像(视频),且其性能取决于多模态信息(样品元数据,视觉信息,声音信息等)的对齐程度。

    机理猜想者。我们预期大语言模型十分擅长将已建立的科学原理用于解释新的实验现象。科学机理探索阶段的很大一部分工作都是模式匹配型工作(例如,从光谱中提取微小的特征并与标准数据库进行比较),这些都在大语言模型的能力范围内。在不久的将来,这个工作流将会变的非常简单直接,我们只需要问大语言模型:我们制备并测试了一个样品,它的成分是xxx,处理工艺和参数是xxx,其性能是xxx。这是所有的表征结果(扫描电子显微镜,X射线衍射等),请给出10个理由详细表述为什么这个样品的性能这么好。人类研究者可以从大语言模型生成的一系列叙述中筛选出最合理的解释,并以此为基础完善整个机理解释。然而,这个任务是所有我们预想的大语言模型的角色中最具有挑战性的,其实现的前提条件包括(i)图像输入和与科学术语的对齐,(ii)从专业物理科学数据库中检索特定信息的能力,(iii)大语言模型在科学期刊正文和附录的预训练,(iv)大语言模型有能力调用一系列前沿的子领域的机器学习模型或是仿真模型。

    CRESt只是大语言模型协助科学家的一个起点,我们相信大语言模型的真正潜力在于其假说生成能力。人类拥有相对有限的知识库,但出色的因果推理能力使得我们能够给出虽然数量不多但一针见血的假说。相比之下,人工智能有着广泛的知识库以及从大数据中提取统计信息的能力,因此它们可以在短时间内生成大量的,没那么精准的假说。因此,这不是一个人工智能与人类竞争的故事,而是人工智能补足人类短板的故事。在“AI suggests, humans select”的合作模式下,双方都能发挥出各自的优势,“各尽其才”。

    原文详情:

    视频介绍:https://youtu.be/POPPVtGueb0

    预印本地址:https://doi.org/10.26434/chemrxiv-2023-tnz1x


  • 原文来源:http://www.cailiaoniu.com/252722.html
相关报告
  • 《这种“特立独行”的神奇材料 将让“钢铁侠”装备变为现实》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2020-03-10
    • 你知道世界上最“黑”的材料是什么吗?近期,国外一所学院的研究人员利用碳纳米管制造出一款材料,可吸收99.96%以上的入射光,堪称材料家族中的“黑洞”。无独有偶,同样是碳纳米管材料,研究人员利用超过1.4万个碳纳米管晶体管,制造出16位微处理器芯片,并向世界发出了“Hello, World”的信息。    碳纳米管,作为一种拥有特殊结构的一维量子材料,具备诸多超乎寻常的力学、电学、热学等物理性能和化学性能。请看——   性能优异的“材料之王”    在碳纳米管没有出现在世人面前之前,硅是半导体家族中当之无愧的“王者”。现有每个晶体管的核心都是由硅制成的半导体组件。根据晶体管的“开启”和“关闭”状态,来显示是否有电流通过,进而在计算机中呈现出1和0的“计算机语言”。只不过,硅晶体管目前在体积和性能上逐渐面临发展瓶颈,人们于是将更多地目光集中到碳纳米管等新兴材料上。    碳纳米管又名巴基管,是一种由呈六边形排列的碳原子构成的数层或数十层的同轴圆管,管的直径一般为2到20纳米。与头发丝相比,碳纳米管的直径只有它的几万分之一,目前公开报道的最细碳纳米管直径为0.4纳米。正是由于碳纳米管几乎只有原子那么厚,且可以很好地传输电流,人们才能用碳纳米管制造出比硅更好的半导体。    研究表明,碳纳米管处理器的运行速度比硅处理器快2倍,功耗却只有硅处理器的1/3,性能优异的新一代电子产品“王者”呼之欲出。    事实上,碳纳米管还有着许多堪称“特立独行”的神奇特性。作为迄今为止人类发现的力学性能最好的材料,碳纳米管有着极高的拉伸强度、杨氏模量和断裂应变。与型号ASTMA228的高强度钢相比,碳纳米管的强度是它的270倍,弹性约为它的5倍,密度却只有它的1/6。    此外,碳纳米管在电学、热学和光学等方面也有着超越传统导电、导热材料的优异表现。从理论上讲,碳纳米管的导电效率是硅的10倍,一旦碳纳米管得到广泛应用,“硅谷”可能就真的名不副实了。    早在1985年,“足球”结构的富勒烯一经发现,立刻引来了全世界的目光。以“足球”结构为基础,稍加改动,就可形成具有中空圆柱状结构的碳纳米管。1991年,日本研究人员首次在碳纤维中发现了碳纳米管。随后,研究人员又发现了碳纳米管优异的导电性等诸多性能。目前,人们正在向着批量制备单根长度达到米级甚至公里级以上的碳纳米管而努力。    想要“驯服”碳纳米管这一“材料之王”实属不易。虽然碳纳米管是一种半导体,但其目前的制造过程需要用到金属,不可避免地会在成品材料中混入金属杂质。同时,将碳纳米管转化为电子元器件,需要将纳米管放置在极其精确的位置上。目前,人们还没有掌握能让碳纳米管在特定位置生长的方法。碳纳米管也对其“出生”的“产房”提出了极高要求:一旦环境温度过高致使催化剂失去活性,碳纳米管就会停止“生长”;相反,如果控制上稍有差池,碳纳米管又会“疯狂地生长”。    事实上,早在2013年,有关研究人员就制造出了拥有178个晶体管的第一台碳纳米管计算机,其中每个晶体管包含大约10到200纳米长的碳纳米管。如今,已有直径约为1微米的碳纳米管计算机晶体管研制成功,每秒能开关约100万次。此外,研究人员还发现碳纳米管有着优异的储氢性能,有望成为氢能电池的制造材料,可广泛应用于电动车、潜艇、电力机车等领域。    人们还计划将千千万万根碳纳米管拧在一起组成宏观纤维,这种被称为“终极纤维”的碳纳米管纤维,将对21世纪高端科技发展具有重大战略意义。一旦人们在“驯服”碳纳米管领域取得突破,一场由碳纳米管发端的科技革命即将“引爆”全球。    应用前景或将改变世界   在地球和月球或太空基地之间搭建一座“太空天梯”,这一场景曾出现在包括《三体》在内的诸多科幻小说中。要想建造月地“太空天梯”,就要能找到一种能跨越38万公里距离且不被自身重量拉断的材料。作为迄今为止发现的力学性能最好的材料之一,碳纳米管有着极高的拉伸强度,或将助力人们从地球“爬向太空”。未来,人类进入太空或运送物资进入空间站,或许就能像乘坐电梯一样来去自如。    同样借助于碳纳米管独特的力学特性,研究人员正尝试研究制造诸如“拉不断”的绳子、“扯不破”的纤维布和“打不透”的防弹衣等“黑科技”产品。风力发电机使用的叶片,对材料的强度和刚度要求极高,利用碳纳米管纤维制成的增强复合材料将成为最好的选择。碳纳米管纤维增强复合材料还具有极好的抗疲劳性,在桥梁、建筑中应用,不仅可以提高强度和抗震能力,还将延长其使用寿命。未来,包括高尔夫球杆、钓鱼竿、网球拍、自行车、汽车、高铁列车等,都可以选用碳纳米管材料。    把能量储存到碳纳米管中,类似“钢铁侠”一般的装备也将成为现实。目前,国外某实验室正牵头研发一种能够对外提供电能的新型服装。这种将碳纳米管变成纺织面料的服装,将为战场上使用的照明装置、夜视仪和通信设备等提供电力供应,势必进一步减轻单兵负担。   此外,有研究人员还通过合成碳纳米管材料,研制出一种能灵敏感知压力变化的传感器织物,可在运动训练领域发挥重要作用。人们还尝试将碳纳米管制成透明导电的薄膜,用作触摸屏的替代材料。    关于碳纳米管的未来应用还有许许多多。由于特殊的结构和介电性质,碳纳米管表现出较强的宽带微波吸收性能,是一种有着光明前途的理想微波吸收剂,可用于隐身材料、电磁屏蔽材料或暗室吸波材料等。同时,研究人员畅想将碳纳米管制作成可注射入人体内的微型芯片,还计划将碳纳米管打造成能杀死人体内癌细胞的纳米机器人。   
  • 《《科学》:意大利科学家“看见”单原子催化石墨烯生长》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-06-28
    • 石墨烯是一种非常薄的二维材料,仅由单层碳原子组成。石墨烯因具有多种优秀的特性,如像塑料一样柔韧,稳定的晶格结构使其具有良好导电性,机械强度比世界上最好的钢铁还要高100倍,所以在工业和技术领域具有多种用途,被认为是近乎完美的材料。然而,石墨烯很难生产,因此其价格昂贵。 来自意大利的里雅斯特大学和国家研究理事会的科学家研究发现,在金属镍表面上,移动的金属镍原子起到催化剂的作用,促进了石墨烯的形成。实验上,通过毫秒分辨率扫描隧道显微镜成像,他们直接捕获到了单个镍原子在生长的石墨烯薄片边缘处的催化作用。从记录的视频中可以清楚地看到,成长过程是逐行进行的,就像一台编织机编织一条线,形成一块布一样。力场分子动力学和密度泛函理论的计算,也印证了这一结果。该研究成果发表在《科学》期刊上。 金属镍基底上生长石墨烯相关过程的研究和发现,为石墨烯的生产技术开辟了新的可能性,对于在工业水平上开发新的和更高效的石墨烯生产工艺具有重要意义。