《脑启发设计:人工智能的进化之路》

  • 来源专题:人工智能
  • 编译者: 高楠
  • 发布时间:2024-07-08
  • 作者:微软亚洲研究院
    编者按:你可以用左手(不常用的那只手)的小指与食指拿起一件物品么?
            试完你是不是发现自己竟然可以毫不费力地用自己不常用的手中,两根使用频率相对较低的手指,做一个不常做的动作。这就是人类大脑不可思议之处——无需经过特别的训练,大脑就能够在短时间内以低功耗的方式控制身体完成各种复杂行为,甚至是全新的动作。相比之下,人工智能虽然是人类智慧的产物,但在很多方面还远不及人类大脑。
    为此,微软亚洲研究院(上海)团队的研究员们从理解大脑结构与活动中获得灵感,开发了一系列涵盖大脑学习、计算过程不同层级的创新技术,包括模仿脑神经回路连接方式,可高效处理众多任务的 CircuitNet 神经回路网络;可应用于时间序列预测,更适配神经拟态芯片的新型 SNN(脉冲神经网络)框架和策略;以及可为具身智能提供理论指导的贝叶斯行为框架。这些探索为未来的人工智能技术发展提供了新的可能。

            从能耗的角度来看,人类大脑只需要大约20瓦的功率即可维持运转,这约等于一个节能灯泡的功耗。但随着人工智能大模型参数和规模的增大,其能源需求远高于传统的数据中心。主流的大语言模型训练过程预计会消耗上千兆瓦的电力,相当于数百个家庭一年的用电量。这种能源消耗的增长趋势显然不利于人工智能技术的可持续发展。那么如何通过新的处理机制解决能耗问题,就成了信息科学领域一个紧迫且前沿的挑战。《千脑智能》一书为我们提供了启示:“要创造出真正智能的机器,我们首先需要对大脑进行逆向工程。我们研究大脑,不仅是为了理解它的工作原理,更是为了探索智能的本质。”其实,人工智能本身就是人类对大脑探索的产物,在计算机诞生之初,人们就已经利用神经连接模式+数字计算的方式模拟大脑。但受限于当时的算力和人们对大脑粗浅的认知,人工智能发展非常缓慢,甚至一度被束之高阁。    

            近几十年来,随着神经科学家对大脑结构的深入理解和计算资源及相关技术的增强,以脑启发为核心的“人工智能文艺复兴”也掀起了新一轮热潮,促使科研人员重新定位大脑机制对人工智能的作用。来自微软亚洲研究院(上海)的研究员们跨越计算机和脑科学专业知识,深入理解大脑的结构与行为活动,针对大脑学习和计算过程,从神经元、网络层和更高级别的系统层出发,分别设计研发了高性能的脉冲神经网络(SNN)、参数效率更高的回路神经网络(CircuitNet),以及提升决策效率的贝叶斯行为框架,促进了人工智能网络向着更低功耗、更高效率、更好性能的方向良性发展,同时也为具身智能发展提供了理论和方法。

    CircuitNet:模拟大脑神经元连接,实现更低功耗与更高性能
            人工神经网络(ANN)已经被广泛应用于人工智能的众多领域,包括自然语言处理、机器学习、语音识别和控制系统等。这些应用的成功,很大程度上得益于它们对大脑神经元工作模式的模仿。神经元是大脑最基本的单元,它们之间通过复杂的连接模式相互作用来传递和处理信息。但早期的人工神经网络设计相对简单,仅能模拟一两种连接模式。
    随着神经科学的发展,人们发现大脑神经元的连接方式多种多样,其中有四种常见模式:前馈激励和抑制、反馈抑制、侧抑制和相互抑制。然而,现有的许多人工神经网络,如具有残差连接的网络,只能模拟前馈激励和抑制模式。即便是能够模拟循环模式的递归神经网络(RNN),在信息传入前也无法处理上游神经元间的复杂相互作用,从而影响了神经网络在不同机器学习任务中的表现。
            生物神经网络与人工神经网络的整体连接模式也大不相同。生物神经网络的一个显著特点是局部密集连接与全局稀疏连接的结合。尽管单个神经元可以有数千个突触,但它们大多数位于一个脑区内,形成针对特定任务的功能集群。只有少数突触作为不同脑区之间的桥梁,延伸到其它功能集群,而人工神经网络通常不具备这样的特性。此外,人工神经网络中的许多参数也被证实是冗余的,增加了网络的复杂性。基于对大脑神经连接的新理解,研究员们提出了新的回路神经网络 CircuitNet,它能够模拟包括反馈和侧向模式在内的多种神经元连接模式。CircuitNet 的设计还借鉴了大脑神经元局部密集和全局稀疏连接的特性,通过不同电路模式单元(Circuit Motif Unit, CMU)的输入端和输出端的稀疏连接,实现了信号在不同 CMU 之间的多轮传输。实验结果表明,CircuitNet 在函数逼近、强化学习、图像分类和时间序列预测等任务中的表现超越了当前流行的神经网络架构。而且,在各种类型的任务中,CircuitNet 在达到与其它神经网络相同性能的同时,具有相当或更少的参数,展示了其在机器学习任务中的有效性和强大的泛化能力。
    CircuitNet: A Generic Neural Network to Realize Universal Circuit Motif Modeling
    https://openreview.net/pdf?id=Fl9q5z40e3
    让SNN网络更适用于时间序列预测任务的新框架
            脉冲神经网络(SNN)因其能效高、事件驱动范式和生物学上的合理性,正逐渐受到业内的重视。SNN 的设计灵感来源于生物神经网络中神经元间的信息传递方式——神经元不是在每次迭代传播中都被激活,只有膜电位达到特定阈值时才被激活,进行信号传递。这种事件驱动机制使得 SNN 只在接收到有效刺激时才进行信息处理,从而避免了无效计算,极大地提高了运算效率和能效比。然而,研究员们发现,现有的 SNN 设计大多聚焦于其离散的事件驱动特性,有的会忽略其时间属性,有的则为了适应事件驱动范式过程,过度简化序列数据模式。这些方法虽然让 SNN 在图像分类、文本分类和序列图像分类任务上实现了与人工神经网络接近的性能,但并未充分发挥 SNN 在处理时间信号方面的潜力。研究员们认为,时间序列预测是 SNN 一个理想的应用场景。作为现实数据分析的重要组成部分,时间序列预测广泛应用于交通、能源、医疗等领域,旨在基于按时间顺序排列的历史数据来预测未来。但是,将 SNN 应用于时间序列预测还面临两大挑战:
            SNN 中脉冲值的离散特性与时间序列数据的浮点属性之间存在巨大的差异,需要一种有效的机制来减少在将浮点值转换为脉冲序列时的信息丢失和噪声。如何选择用于时序数据的 SNN 标准化模型目前还缺少一个指导方针,进而加剧了任务的复杂性,这就需要对 SNN 架构及其参数进行深入探索,以适应不同时间序列数据的特定特征。研究员们提出了一个用于时间序列预测任务的 SNN 框架。该框架充分利用了脉冲神经元在处理时间序列信息上的高效性,成功实现了时间序列数据与 SNN 之间的时间同步。研究员们还设计了两种编码层,可以将连续时间序列数据转换为有意义的脉冲序列。这之后,研究员们又利用多种脉冲化的时间序列模型对脉冲序列进行了建模,得到了最终的预测结果。
            通过在多个时间序列预测基准集上的测试,研究员们证实了 SNN 方法在时间序列预测中的有效性。该方法不仅展现出与传统时间序列预测方法相媲美或更优的性能,而且显著降低了能耗。此外,在分析实验中,研究员们还展示了 SNN 如何捕获时间序列数据中的时间依赖性,并发现 SNN 确实能够模拟时间序列数据的内在动态。这项研究为 SNN 领域提供了一个既节能,又符合生物学原理的时间序列预测新方案。
    Efficient and Effective Time-Series Forecasting with Spiking Neural Networks
    https://arxiv.org/pdf/2402.01533
    大脑中枢模式发生器与位置编码双加持,让SNN序列预测更上一层楼
             尽管 SNN 在多个领域取得了显著进展,但它们在适应不同类型任务时仍面临挑战。SNN 作为事件驱动的系统,缺乏有效机制来捕获索引信息、节奏模式和周期性数据,从而限制了它们处理自然语言和时间序列等数据模式的能力。而且,SNN 依赖于脉冲形式的通信,这使得并非所有适用于人工神经网络的深度学习技术都能直接迁移到 SNN 上。为了克服这些限制,研究员们进一步从生物神经学机制中汲取灵感,基于人类大脑中枢模式发生器(Central Pattern Generator, CPG)和位置编码(Positional Encoding,PE)技术,开发了针对 SNN 的新型位置编码技术 CPG-PE。
            中枢模式发生器(CPG):在神经科学中,CPG 是一组能够在不需要节奏输入的情况下,产生有节奏的模式输出的神经元。这些神经回路位于脊髓和脑干中,负责产生控制运动、呼吸和咀嚼等重要活动的有节奏信号。位置编码(PE):PE 是人工神经网络中的一项关键技术,尤其在序列处理任务中尤为重要。通过为输入序列的每个元素赋予位置信息,PE 使神经网络能够识别序列中元素的顺序和相对位置。CPG 和 PE 都能产生周期性输出,CPG 是相对于时间的输出,而 PE 则是相对于位置的输出。研究员们将两者类比,使 CPG-PE 可以编码时间或空间的位置信息,预测神经信号的来源或位置。
            在 Metr-la(洛杉矶高速公路平均交通速度数据)、Pems-bay(湾区平均交通速度数据)、Electricity(以千瓦时 kWh 测量的每小时电力消耗数据)和 Solar(太阳能发电数据)四个真实世界数据集上进行的时间序列预测实验表明,采用 CPG-PE 策略的 SNN 在时间序列分析方面显著优于没有 PE 特性的神经网络。同时,CPG-PE 可以无缝集成到任何能够处理序列的 SNN 中,理论上可以实现与 SNN 硬件的兼容,适配各类神经拟态芯片。
    Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators
    https://arxiv.org/pdf/2405.14362
    贝叶斯行为框架:为具身智能提供理论指导
            在心理学和认知神经科学领域,以人类为代表的智能生物群体被认为会执行两类行为:习惯性行为和目标导向行为。习惯性行为是指为了最大化利益而自动执行的动作,无需意识思考或意图的参与,例如寻找食物和避免危险。目标导向行为是指为了实现特定目标而执行的动作,例如有计划地前往某个地点。传统上认为,在认知科学和机器学习中,习惯性行为和目标导向行为由两套独立的系统控制,因此在建模时,研究人员通常会为这两种行为设计独立的模型。
            然而,微软亚洲研究院的研究员们认为,这两种系统应该更紧密地结合,实现协同学习和工作。尽管在大脑中这两种系统之间的相互作用尚未完全明了,但习惯性行为和目标导向行为共享着诸如脑干这样的下游神经回路。两种行为共享低级运动技能,且每个系统都可能利用对方学习到的高级动作。例如,习惯性行为虽然缺乏灵活性,但通过练习可以提供熟练的运动技能,这些技能可以被目标导向行为用于更复杂的任务规划。那么如何在保持两种行为差异的同时实现协同?为此,研究员们提出了一个基于变分贝叶斯方法的理论框架——贝叶斯行为(Bayesian Behavior)框架,用于理解感知运动学习中的行为。其核心创新在于引入了一个贝叶斯“意图”(intention)变量,从而有效地连接了习惯性行为与目标导向行为。习惯性行为由感官输入计算的意图先验分布驱动,无需具体目标。目标导向行为则由一个通过最小化变分自由能推断(active inference)的目标条件意图后验分布引导。
            在视觉引导的感知运动任务中进行模拟实验的测试结果显示,贝叶斯行为框架所得出的结论与神经科学和心理学实验的观察数据相吻合。这一发现不仅为认知科学中“行为”的理解提供了新的视角,也为具身智能的构建提供了理论基础。例如,人类能够轻松地用左手食指和小指拿起东西,或者原地转圈,未来的具身智能也可能完成这种未曾学习过的动作,展现出更高的适应性和灵活性。
    Synergizing Habits and Goals with Variational Bayes
    https://www.nature.com/articles/s41467-024-48577-7
    该论文已在《自然-通讯》(Nature Communications)杂志上发表。
    跨领域研究让人工智能向节能高效进化
            从达尔文进化论的角度来看,现在的主流人工智能模型在未来可能会面临淘汰。在生物进化的过程中,物种的基因变异是繁殖下一代时的常态。那些有利于生物适应环境的变异,将通过环境的筛选,以“适者生存”的原则被保留下来。然而,将这一概念应用于人工智能时,我们会发现能耗问题并不利于人工智能的发展和“进化”。
            借鉴人脑的工作原理,构建脑启发的人工智能,不失为促进人工智能技术向节能高效方向发展的有效途径。这一趋势已经引发了新的研究热潮,包括对大脑理解的研究、基于神经元构建新的语言模型、根据不同脑区功能设计的 MoE 架构等脑启发人工智能正蓬勃发展。在微软亚洲研究院进行脑启发式人工智能研究的过程中,研究员们更加体会到跨学科、跨领域专家协作支持的重要性。CircuitNet、SNN 时间序列框架、贝叶斯行为框架等创新成果的背后,凝聚了来自复旦大学、上海交通大学及日本冲绳科学技术大学院大学等机构的神经科学和脑科学专家的专业知识和贡献。未来,随着对大脑机理的深入理解和技术的不断创新,我们有望增进对智能本质的理解,构建出更加智能、高效且环保的人工智能技术,更好地服务于人类社会。
  • 原文来源:https://www.msra.cn/zh-cn/news/features/brain-inspired-ai
相关报告
  • 《神经科学会成为人工智能“超进化”的关键吗》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2019-03-20
    • 人工智能会取代人类吗?这个问题一度引发全民热议。虽然目前人工智能正在快速提“智”,但是这不代表它真的很聪明。相反,很多时候它还很傻很天真,仍然需要向人脑学习。 近日,以色列魏茨曼科学研究学院计算机科学系教授希蒙·厄尔曼发文表示,相信神经科学能为人工智能发展提供进一步的助力。那么,人工智能和神经科学究竟有什么关系?神经科学到底如何进一步助力人工智能发展?深度融合神经科学的人工智能将发生哪些变化? 神经科学和人工智能本属同源 谈到人工智能和神经科学之间的关系,中国科学院上海生命科学研究院副研究员王小理用两句话来概括:同源分流、学科独立;交叉融合、分久必合。 最初,人工智能与神经科学是两门各自独立的学科,有着不太一样的研究对象、研究方法体系。从学科起源的时间原点来看,人工智能学科以1956年美国达特茅斯学院夏季讨论班为缘起;而神经科学诞生的标志可以回溯到1891年的神经元学说。这样看神经科学算是人工智能学科的“前辈”。 神经科学更多地侧重于生物学意义上的神经活动的规律,解析包括思维、情感、智能等在内的高级神经活动的发生机制,而意识起源问题,则是神经科学的终极目标,研究方法上神经科学是以自然现象归纳为主的“实验科学”。而人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究对象不是智能而是智能操控,现阶段研究方法上是侧重于对复杂现象进行模拟仿真的“计算科学”。 “但可以将神经科学和人工智能的关系简单理解为源和流。”王小理告诉科技日报记者,人工智能的兴起和发展离不开神经科学成果的滋养。 正如希蒙·厄尔曼文章所述,早期人工智能领域的科学家将生物神经系统作为参照对象,创造出了近年来盛行的“深度网络”脑启发架构,这是一个非常鲜明的“源流”案例,也一直为神经科学家和人工智能领域科学家所津津乐道。但有些人工智能领域的专家,认为深度网络前期是仿脑,后期发展了独立的方法,因此认为,人工智能有自己的方法体系,基本可以抛开脑科学。这样的观点其实是值得深入讨论的。 中国科学院神经科学研究所蒲慕明院士曾向记者表示,近年来,脑与神经科学、认知科学的进展使得人们在脑区、神经微环路、神经元等不同尺度观测的各种认知任务中,获取脑组织的部分活动数据已成为可能,获知人脑信息处理过程不再仅凭猜测,通过多学科交叉和实验研究获得的人脑工作机制更具可靠性。因此,脑科学有望为机器学习、类脑计算的突破提供借鉴。 但是,人工智能对神经科学发展的反哺或反馈作用也是客观存在的。在神经科学基础研究阶段,人工智能可以辅助研究人员解析复杂的脑神经信号、脑神经图谱实验数据,构建和模拟大脑模型系统等。在转化应用阶段,人工智能还能加速脑科学成果的应用,例如大脑疾病诊断与新疗法成果的临床转化等。 打开人工智能“黑箱”的几条通路 事实上,没有神经科学大的理论突破,没有对智能生物本原的认识,人工智能中的“智能”概念很可能就一直是个“黑箱”,而智能模拟与扩展就可能一直在“外围”打转。比如,美国国家工程院《21世纪人类面临的14大科技挑战》报告就认为,人工智能目前存在的部分问题是源于设计中并没有充分考虑真实的大脑情况。而通过对人脑的逆向工程来揭示大脑的秘密,可以更好地设计出能同时处理多重信息流的计算设备。 目前神经科学在助力人工智能发展上有几条通路。王小理介绍,具体路径上,可以延续认知经验主义思路的人工智能发展方向。例如,对于人工智能而言,目前总是用一个特定的任务去训练它,而忽略了它接触其他事物的过程。如果给智能体一个类似成长环境和成长过程,是不是会让它更智能呢?人类的智慧是建立在沟通之上的,目前的人工智能体还没有自主沟通能力, 这也是目前的人工智能水平与强人工智能的差距所在,也是未来的发展方向。 但也可能,希蒙·厄尔曼提出的借鉴人类先天认知系统更具有意义。深入理解大脑的原始能力,从而实现高级的机器逻辑能力。人类具备学习如何学习的能力,如果让智能体学习如何学习,那么这种二阶学习的关系也许会让它学得更快,如果未来智能体有了想象力和计划能力,那么它也许真的可以创造出一些我们人类很难创造出的东西。 此外,神经科学助力人工智能,在人工智能重大技术领域也有几个方向。例如,构建统计关联与特征关联相结合的新型学习理论,实现“知识驱动”与“语义驱动”关联统一;构建融合深度学习与强化学习、演化计算、主动学习、毕生学习等仿生和自然计算理论的新型理论框架;实现大规模并行神经网络、进化算法和其他复杂理论计算;具有自主学习能力的通用性人工智能系统等。 未来两者深度融合大有可为 那么,深度融合神经科学的人工智能将会发生什么变化呢? 对此,王小理认为,目前神经科学与人工智能的融合,只占生物大脑计算原理的冰山一角。准确预见未来人工智能将如何发展很难,但如果洞察神经科学、人工智能的学科发展规律和人类经济社会发展大趋势,粗略勾勒未来发展阶段还是可能的,这对于找准创新突破口,明确创新主攻方向非常关键。这也是包括我国在内开展相关脑科学预测和技术预见的初衷之一。 从当前到2025年,神经科学继续保持高速发展态势,但颠覆性的理论成果还不多,在这一时期,人工智能和大数据技术是神经科学发展的“加速器”。而到2030—2035年,神经科学将迎来第一轮重大突破,在神经感知和神经认知理解方面出现颠覆性成果,从而反哺、革新人工智能的原有算法基础和元器件基础,人类社会进入实质性类脑智能研究阶段。 到2050年,神经科学将迎来第二轮重大突破,在情感、意识理解方面出现颠覆性成果,开发出一个多尺度、整合、可验证的大脑模型理论,类脑智能进入升级版,并将推动人脑的超生物进化,神经科学和类脑智能学科融为一体,人类社会全面进入强人工智能时代。当然,围绕神经科学和人工智能特别是强人工智能,还有许多科学理论和社会与伦理方面的问题。 “我们相信,未来神经科学领域大有可为、未来神经科学与人工智能融合大有可为。”王小理说,从人类科技文明长河来看,神经科学和人工智能是同一枚硬币的两个面,虽然相互独立,但都有共同的指向:为人类的生存和意识演化提供新可能。
  • 《人工智能帮助新药研发》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-12-03
    • 在古代,神农尝百草,这其实就是人工筛选药物的过程。 在现代,看过电影《我不是药神》的人也会知道,新药研发的成本是极高的。 在综艺节目《奇葩说》中,经济学家薛兆丰提到:每一款新药研发的周期大约是20年,平均每款新药的研发费用高达20亿美元。 所以,新药研发是一个高风险高回报的行业。 人工智能时代,情况有了很大的变化,人工智能可以对新药研发有很大的帮助。 药的分类 要理解人工智能对新药研发的帮助,首先需要对药物做一个大致的分类。从药物分子的大小来分,一般可以把药物分为二类。 1. 化学药 化学药的起效成分是单一、明确的化学小分子,分子量通常小于 1000 道尔顿(也就是1000个质子质量)。这种药可以通过实验室化学合成制备,其分子结构可以用紫外可见分光光度计,核磁共振与红外光谱仪等仪器鉴定。这种药物分子可以直接进入细胞产生药效。 著名的阿司匹林(aspirin)就是一种化学药,阿司匹林于1899年3月由德国化学家发明,可用于治疗感冒、发热、头痛等病症。再比如伟哥(viagra)是由美国辉瑞研制开发的一种口服治疗男性性功能障碍的药物,在音乐人李宗盛等人演唱的《最近比较烦》这首歌中,有这样一句“我梦见和饭岛爱一起晚餐, 梦中的餐厅灯光太昏暗, 我遍寻不着那蓝色的小药丸”,这个蓝色的小药丸就是伟哥 ,这也是一种化学药。 2. 生物药 生物药一般是抗体、蛋白(多肽)、核酸类药物,分子量通常远大于1000 道尔顿。所以生物药是大分子药。 比如治疗糖尿病的人工胰岛素就是一种生物药。1958年,中国科学院在王应睐、曹天钦、邹承鲁、钮经义、沈昭文等先生的带领下,正式启动人工合成胰岛素项目,1966年取得巨大成功。我国人工合成的胰岛素其实就是一种人工合成的蛋白质分子,这是一种生物药。 对于人工智能新药研发来说,多数情况下比较适合处理化学药,对于大分子生物药的研发,目前的人工智能技术还有点力不从心。 新药研发与药物靶点 要理解新药研发,我们还要看一下为什么一个人会生病——因为药物是用来治病的。从分子生物学的角度来说,有的病情是由于分子的表达缺失引起的,比如胰岛素降低引起糖尿病;也有的病情是因为分子的表达过强引起的,比如组胺过高引起过敏。 那么,人为什么会生病呢?因为身体是由细胞组成的,细胞是由化学小分子和生物大分子共同组成,它们并不是简单地拼凑在一起,而是相互级联作用构成一个复杂庞大的网络,不同的生理功能可以看成这个巨大网络中一条条串联的线路。 我们身体的疾病,除了外科损伤之外,多数是这个网络上某个线路发生了异常,这就好像某条交通线发生了堵塞一样。吃药的目的就是打开这个拥堵点。这个拥堵点也就是药物分子需要作用的“靶点”。 在分子生物学出现之前,没有药物靶点这个概念。在那个时候,无论是全球各地的草药,还是偶然发现的青霉素,都是根据经验、猜测或者迷信来揣度人体的发病原因。中药就是其中一个例子,一般中药有副作用,这就是因为中药不是根据分子生物学设计出来的,所以它的靶点很散乱,相当于是用散弹枪去打靶,而现代西药则好像是用狙击枪去打靶。 因此,人体内的所有分子都可能成为潜在的靶点,这些分子有可能在细胞膜上,或者在细胞质里,有些可能在细胞核里;这些分子也可能在血液里,或者在大脑中——不同分子的特点不同。比如抗体等生物大分子只能与体液和细胞膜上的分子结合,而化学小分子则更容易穿透细胞膜甚至进入细胞核发挥作用。不同药物进入体内的方式是不同的,一个好的药物需要保证它们不要在进入体内的途中损失掉(比如被胃液的酸性腐蚀等等)。而且药物的设计必须有很好的靶向性,比如有的药需要进入大脑,那么就需要穿过血脑屏障;有的药为了不影响婴儿,则希望它不要透过母婴屏障。最好的药物设计的标准是:设计出来的药只与想治疗的器官和分子发挥作用,而不产生其他的副作用。但是,由于生物功能是一条线路,这个线路上可能不止一个分子有成为靶点的潜力,因此要找到最关键的靶点才会最有效果。但事情没有那么简单,在生物体中,同样一个分子可能是多功能的,如果抑制了这个分子,可能就会引起其他正常功能的损伤,这就是产生副作用,有些副作用还很严重,因此,要选择非常干净特异的分子作为药物靶点。 药物靶点这个概念是分子生物学发展的产物,尤其是基因测序技术发展起来之后才有的新概念。通过研究找到真正作用的原因(分子机理),可以为药物研发提供了新的原理。 人工智能帮助新药研发 人工智能是需要有大数据作为原料的,而新药研发领域其实是一个大数据非常丰富的宝库,因此这为人工智能提供了用武之地。比如1959年《药物化学》杂志创刊至今,至少发表了45万种化合物作为药物的研究对象,这是一个巨大的数据库,对于这样的大数据,人工智能可以发挥它的独特作用。 不久前,《科学美国人》与世界经济论坛发布了2018年十大新兴技术,人工智能辅助化学分子设计——机器学习算法加速新药研发就是其中之一。 目前,在全球有至少100家企业正在探索新药研发的人工智能方法,在国外,葛兰素史克、默克、强生与赛诺菲公司都已经布局人工智能新药研发。在中国,也涌现了深度智耀、零氪科技与晶泰科技等人工智能新药研发企业,药明康德也战略投资了美国的一家人工智能新药研发公司。 对于化学分子的设计而言,以前的设计是通过人员对分子各种侧链和基团化学性质的经验,人工设计药物。这个过程就跟程序员写程序一样,有的人有天分,写一个程序就能成功运行,有的人没天分,设计了许多也没有好用的。因此,在当时就有很多人说,药物的化学设计是一种艺术,甚至是一种玄学。 现在,则可以用机器来学习药物和药物靶点的结合特点,从而让机器来进行药物设计,这也能大大提高成功设计的概率。人工智能通过计算机模拟,可以对药物活性、安全性和副作用进行预测。 人工智能可以应用在药物开发的不同环节,包括虚拟筛选苗头化合物、新药合成路线设计、药物有效性及安全性预测、药物分子设计等。为什么人工智能提高新药研发的效率呢?因为人工智能有很强大的发现关系的能力,还有很强大的计算能力。在发现关系方面,人工智能可以发现药物与疾病的连接关系,也能发现疾病与基因的连接关系。在计算能力方面,人工智能可以对候选的化合物进行筛选,更快筛选出具有较高活性的化合物,为后期临床实验做准备。人工智能在化合物合成与筛选方面可以比传统手段阶段40%的时间,每年为药企节约上百亿的筛选化合物的成本。 人工智能技术的出现,为中国在新药研发的国际竞争中实现弯道超车提供了一定的可能性。