《合成生物学能激发下一波人工智能吗?》

  • 来源专题:人类遗传资源和特殊生物资源流失
  • 编译者: yanyf@mail.las.ac.cn
  • 发布时间:2019-12-12
  • 在20世纪初建造世界上第一架飞机的过程中,莱特兄弟从鸟类“富有洞察力的”运动中获得了灵感。他们观察并逆向设计了自然界中翅膀的各个方面,这反过来又帮助他们在空气动力学和推进方面做出了重要的发现。

    同样,要制造会思考的机器,为什么不从我们两耳之间的三磅物质中寻找灵感呢?人工智能的先驱、图灵奖的获得者杰弗里·辛顿(Geoffrey Hinton)似乎同意这个观点:“我一直认为,让人工智能发挥作用的唯一方法,就是用类似人类大脑的方式进行计算。”

    那么,人工智能(AI)的下一步是什么?下一波人工智能会受到生物学快速发展的启发吗?在分子水平上理解大脑回路的工具能让我们对人类思维如何运作有一个更高的系统层次的理解吗?

    答案很可能是肯定的,在学习生物系统和开发人工系统之间的思想交流实际上已经持续了几十年。

    机器学习的起源:人类脑科学

    首先,生物学和机器学习有什么关系?你可能会惊讶地发现,机器学习的进步在很大程度上源于心理学和神经科学的洞见。强化学习(RL)是机器学习的三种范式之一(另外两种是监督学习和非监督学习),它起源于20世纪40年代的动物和认知神经科学研究。RL是当今一些最先进的人工智能系统的核心,比如广为宣传的AlphaGo,它是领先人工智能公司谷歌DeepMind开发的人工智能代理。AlphaGo在围棋比赛中击败了世界顶级棋手。围棋是一种中国棋类游戏,棋盘组合比宇宙中的原子还多。

    尽管AlphaGo在围棋比赛中表现出了超人的能力,但它的人类对手仍然拥有比它多得多的智力。他会开车,会说外语,会踢足球,在任何环境下都能完成无数其他的任务。目前的人工智能系统在很大程度上无法利用学到的知识来玩扑克,并将其转移到其他任务上,比如玩《妙探寻凶》(Cluedo)游戏。这些系统专注于单一、狭窄的环境,需要大量的数据和培训时间。尽管如此,他们还是会犯一些简单的错误,比如把吉娃娃当成松饼!

    儿童和人工智能系统有什么共同点

    与儿童学习类似,强化学习基于人工智能系统与其环境的交互作用。它采取行动,寻求最大限度的奖励和避免惩罚。在好奇心的驱使下,孩子们是积极的学习者,他们会同时探索周围的环境,预测自己的行为结果,从而建立起随意思考的心智模型。例如,如果他们决定推红色的车,打翻花瓶,或者爬向另一个方向,他们会根据行动的结果调整自己的行为。

    孩子们会体验到不同的环境,他们会发现自己在不同的环境中,以不同寻常的方式,与各种情境和物体的性情进行导航和互动。就像孩子大脑发育可以激发人工智能系统的发展,RL代理的学习机制是平行于大脑的学习机制由释放多巴胺,一种神经递质中枢神经系统的关键——火车前额叶皮层响应的经验,因此形状刺激反应协会以及结果的预测。

    合成生物学和人工智能

    生物学是人工智能最有希望的受益者之一。从研究导致肥胖的令人难以置信的基因突变组合,到研究导致某些细胞失控并产生癌症的错综复杂的途径,生物学产生了大量复杂、令人费解的数据。但是这些数据集中包含的信息通常提供了有价值的见解,可以用来改善我们的健康。

    在合成生物学领域,工程师们试图“重新连接”活的有机体,并用新功能对它们进行编程,许多科学家正利用人工智能设计更有效的实验,分析它们的数据,并利用它们创造突破性的疗法。我最近特别提到了五家公司,它们正在把机器学习与合成生物学结合起来,为更好的科学和更好的工程铺平道路。

    人工一般智能:人工智能的圣杯

    人工一般智能(AGI)描述了一种能够模仿类人能力(如计划、推理或情感)的系统。数十亿美元已经投入到这个令人兴奋的、潜在利润丰厚的领域,导致一些人声称“数据就是新石油”。

    在众多致力于通用人工智能的公司中,有谷歌的DeepMind、瑞士人工智能实验室IDSIA、Nnaisense、Vicarious、Maluuba、OpenCog Foundation、Adaptive AI、LIDA和Numenta。像机器智能研究所和OpenAI这样的组织也将AGI作为他们的主要目标。国际人类大脑项目的目标之一是模拟人类大脑。

    尽管实现AGI所需的人才、工具和高质量数据越来越多,但我们仍有很长的路要走。

    人工智能在我们的日常生活中

    今天,像机器学习(ML)这样的人工智能技术在我们的社会中无处不在,从医疗、制造到交通和战争,但它们被称为“狭义人工智能”。他们确实处理和学习了大量的数据,以识别单个任务中有洞察力和信息丰富的模式,比如预测机票价格、在图像中区分狗和猫,以及在Netflix上生成您的电影推荐。

    在生物学领域,人工智能也在改变你的医疗保健。它正在产生更多更好的候选药物(Insitro),测序你的基因组(Veritas Genetics),越来越早地检测你的癌症(Freenom)。

    我们将何去何从?

    作为人类,我们能够在一个环境中快速获取知识,并将其推广到另一个环境中,跨越新的多种情况和任务,这将允许我们开发更高效的自动驾驶汽车系统,因为它们需要在道路上同时执行许多任务。在人工智能研究中,这一概念被称为转移学习。它帮助人工智能系统从几个例子中学习——而不是传统计算系统通常需要的数百万个例子——来构建一个从基本原理中学习、抽象所获得的知识并将其概括为新的任务和上下文的系统。

    为了制造出更高级的人工智能,我们需要更好地理解大脑的内部工作机制,从而能够描绘出我们周围的世界。在理解生物智能和创造人工智能之间有一个协同的任务,从我们的大脑中寻找灵感可能会帮助我们弥合这个差距。

    ——文章发布于2019年11月28日

相关报告
  • 《NIST与非营利工程生物学研究联合会(EBRC)合作开发合成生物学安全工具,以防止人工智能的潜在滥用》

    • 来源专题:计量基标准与精密测量
    • 编译者:李晓萌
    • 发布时间:2024-04-18
    • 近日,美国国家标准与技术研究院(NIST)与非营利工程生物学研究联合会(EBRC)签订了一项为期两年的合作研究协议,以开发筛查和安全工具,防止与核酸合成相关的人工智能(AI)的潜在滥用,合成生物学领域的发展前景广阔,但也存在严重风险。 NIST发起这项合作是为了完成最近《关于安全、可靠和值得信赖的人工智能的行政命令》中的一项任务,该命令要求包括NIST在内的多个机构根据人工智能的进展,制定核酸合成的标准、最佳实践和实施指南。关于人工智能的行政命令呼吁NIST努力与行业和其他利益相关者合作,制定保障措施,防止与遗传物质合成相关的人工智能的潜在滥用。NIST将与EBRC合作,确定确保公共安全的最佳实践和政策。 负责标准与技术的商务部副部长兼NIST主任Laurie E.Locascio表示:“根据最近的人工智能行政命令,该协议是推动工程生物学安全研究的第一步。”。“这项技术的前景是巨大的,但显然需要保障措施来保护公众,这是创造这些技术的重要第一步。” 研究人员已经使用合成核酸实现了突破性的生物技术创新,如新药和疗法,但合成核酸的可用性和易用性不断增加,引发了安全问题,特别是考虑到人工智能的进步,这可能会对公众、环境和国家安全构成风险。 NIST和EBRC之间的合作旨在确定和描述确保核酸合成安全的必要基础设施。作为合作协议的一部分,这些组织将征求行业、大学、政府机构和其他相关利益攸关方的意见。 EBRC总部位于加利福尼亚州埃默里维尔,是一家非营利性公私合作伙伴关系,致力于将一个致力于推进工程生物学以满足国家和全球需求的包容性社区聚集在一起。
  • 《与五家使用AI工程生物学的合成生物学公司会面》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-09-24
    • 电视和广播称“人工智能即将来临”,它将接替您的工作并在国际象棋上击败您。 但是,人工智能已经来临了,它可以在国际象棋上击败您,这是世界上最好的。在2012年,Google还使用它来识别YouTube视频中的猫。今天,这就是特斯拉拥有Autopilot,Netflix和Spotify似乎“读懂你的思想”的原因。现在,人工智能正在改变合成生物学的领域以及我们如何设计生物学。它可以帮助工程师设计出新的方法来设计基因回路,并且通过已获得的巨额投资(过去10年中的12.3亿美元)及其正在破坏的市场,它可能对人类的未来产生重大影响。 人工智能的概念相对简单,它是具有推理,学习和决策行为的机器编程。一些AI算法(只是计算机遵循的一组规则)在这些任务上非常出色,以至于可以轻易胜过人类专家。 我们听到的关于人工智能的大多数信息都涉及机器学习,这是AI算法的子类,可以从数据中推断出模式,然后使用该分析进行预测。这些算法收集的数据越多,其预测就越准确。深度学习是机器学习的一个更强大的子类别,其中大量称为神经网络(受大脑结构启发)的计算层协同工作以增加处理深度,从而促进诸如高级面部识别(包括iPhone上的FaceID)之类的技术)。 [有关人工智能及其各个子类别的更详细说明,请查看本文及其流程图。] 无论AI的类型或用途如何,我们都处于计算革命之中,它将其卷须扩展到“计算机世界”之外。很快,AI将影响您服用的药物,燃烧的燃料,甚至是您用来洗衣服的洗涤剂。 特别是生物学,是人工智能最有希望的受益者之一。从调查导致肥胖的遗传突变到检查癌细胞的病理样本,生物学产生的数据非常复杂,令人费解。但是,这些数据集中包含的信息通常提供有价值的见解,可用于改善我们的健康状况。 在合成生物学领域,工程师寻求“重新连接”活生物体并为其编程以新功能,许多科学家正在利用AI设计更有效的实验,分析其数据并使用其来创建突破性的疗法。这是五家将机器学习与合成生物学相结合的公司,为更好的科学和更好的工程铺平了道路。 Riffyn催化干净的数据收集和分析 (加州奥克兰,成立于2014年,已筹集了2490万美元) 机器学习算法必须从大量数据开始-但是,在生物学上,要生成好的数据非常困难,因为实验耗时,繁琐且难以复制。幸运的是,有一家公司正在通过简化科学家的工作来解决这一瓶颈。 Riffyn基于云的软件平台可帮助研究人员标准化,定义和执行实验,并简化数据分析,这使研究人员能够专注于进行实际的科学研究,并使使用机器学习算法从他们的实验中获得更深刻的见识成为日常现实。 使用此平台,可以更有效地进行实验,从而导致成本大幅下降,生产率和质量得到改善,并且准备使用复杂的机器学习技术进一步分析数据。这意味着公司可以使用这项技术来开发用于癌症治疗的新蛋白质,并且他们可以比以前更快,更好地做到这一点。里芬(Riffyn)已经与15家全球生物技术和生物制药公司中的8家进行了合作-他们成立于五年前。 Microsoft Research Station B:汇集编程生物学的难题 (英国剑桥,于2019年正式启动) 合成生物学世界中有许多活动的部分,这使得尽可能简化和整合操作变得困难而至关重要。在过去的十年中,Microsoft Research的计算生物学部门B站一直在开发生物学的机器学习模型,以解决此问题并加快从医学到建筑的各个领域的研究。 它的努力也以各种新的伙伴关系的形式获得了回报。借助Synthace,它正在开发用于自动化和加速实验室实验的软件。 B站还与普林斯顿大学合作,通过利用基于机器学习的方法从生物生长不同阶段拍摄的图像中提取图案,研究生物膜背后的机制(与细菌菌落如何产生抗生素抗性有关)。 B站还与牛津生物医学公司合作,该公司利用这些机器学习功能来改善针对白血病和淋巴瘤的有前途的基因疗法。这也许是合成生物学影响最大的领域之一:设计与多种疾病作斗争的疗法。 Atomwise:深度学习解码结构蛋白设计的黑匣子 (总部位于美国加利福尼亚州旧金山,成立于2012年,已筹集了5100万美元) Atomwise正在通过其称为AtomNet的深度学习平台来应对药物开发,该平台可以快速对分子结构进行建模。它可以准确地分析小分子内的化学相互作用,从而预测针对埃博拉病毒至多发性硬化症等疾病的功效。通过利用有关原子结构的数据,Atomwise设计了新颖的疗法,否则将几乎不可能开发。 他们与包括Charles River Laboratories,默克,多伦多大学和杜克大学医学院在内的机构建立了众多学术和公司合作伙伴关系,这些机构正在提供许多现实世界的应用程序和机会来推动这项研究的发展。他们最近还宣布了与江苏汉寿药业集团的高达$ 1.5B的合作,该公司是今年最大的生物制药IPO之一。 尽管Atomwise的分子设计方法功能强大且可以有效抵抗多种疾病,但还没有一种完美的方法来进行计算发现。那就是Arzeda进来的地方。 Arzeda:使用从头深度学习重写蛋白质设计规则 (华盛顿州西雅图市,成立于2008年,已筹集了1520万美元) Arzeda是一家来自华盛顿大学贝克实验室的公司,利用其蛋白质设计平台(当然植根于机器学习算法)来对蛋白质进行工程改造,从工业酶到农作物及其微生物群落。 Arzeda完全从零开始(或从头开始)构建其分子,而不是优化现有分子,以执行自然界中未发现的新功能;深度学习技术对于确保其设计的蛋白质正确折叠(非常复杂的计算问题)并按预期发挥功能至关重要。一旦完成计算步骤,就可以通过发酵(就像啤酒一样)来生产新蛋白质,而绕过自然进化过程以有效地生产全新的分子。 分布式生物:彻底改变流感,癌症,蛇咬等的未来 (加利福尼亚州南旧金山,成立于2012年,由许可技术自筹资金) 在设计范围的另一端,Distributed Bio利用合理的蛋白质工程技术来优化现有的抗体,这些抗体是您体内的蛋白质,可以检测细菌并与其他引起疾病的入侵者抗争,从而创造出新颖的疗法。 Tumbler平台是该公司拥有的众多免疫工程技术之一(从通用流感疫苗到广泛覆盖的蛇抗蛇毒)。 Tumbler使用机器学习方法创建了超过5亿种起始抗体变体,以扩展和量化分子中哪些变化最有价值的搜索空间。然后,它会对序列进行评分,以预测它们在现实生活中与目标的结合程度,并使用“有价值的变化”信息进一步改善得分最高的序列。随着最高级序列的合成和在实验室中的测试,生产周期继续进行。最终,原型分子应运而生,以实现预期的治疗目的-自然界中不一定观察到这种现象,而是结合了所有可能的最佳特征。 Tumbler已帮助实现了超越传统单一靶标药物开发的广泛应用-从设计可同时与多个靶标结合的抗体到创建嵌合抗原受体T细胞(CAR-T)治疗(与Chimera Bioengineering一起)用于癌症治疗具有降低的毒性,此端到端优化平台大规模产生理想抗体的能力是空前的。 尽管这一进展令人兴奋,但人工智能并不是我们对自然界研究的普遍替代,也不是开发治疗人类疾病的唯一方法。有时,它在技术上可能没有用,甚至从道德上讲也不是合理的。随着我们继续获得这项技术的好处并将其日益融入我们的日常生活中,我们必须继续就合成生物学和AI创新的设计,实施和道德操守进行对话。我们站在科学和人类新时代的悬崖上。 ——文章发布于2019年9月19日