《生成式 AI 如何构建更好的抗体》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-07-11
  • 抗体是免疫系统对抗感染的主要武器之一。这些蛋白质已成为生物技术行业的宠儿,部分原因是它们可以被设计成附着在几乎任何可以想象的蛋白质上,从而操纵其活动。但斯坦福大学的计算生物学家 Brian Hie 表示,生成具有有效特性的抗体并对其进行改进优化,涉及“大量的强力筛选”。

    为了了解生成式 AI 工具是否可以减少一些繁重的工作,Hie、Kim 团队使用了称为蛋白质语言模型的神经网络。这些类似于构成 ChatGPT 等工具基础的「大型语言模型」。但是,蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上进行训练。

    研究人员已经使用此类模型来设计全新的蛋白质,并帮助以高精度预测蛋白质的结构。Hie 的团队使用了一种蛋白质语言模型——由 Meta AI 的研究人员开发——来建议抗体的少量突变。

    在它学习的近 1 亿个蛋白质序列中,该模型只接受了几千个抗体序列的训练。尽管如此,该模型的建议中有惊人的高比例提高了针对 SARS-CoV-2、埃博拉病毒和流感的抗体与其目标结合的能力。

    改变批准用于治疗埃博拉病毒的疗法和 COVID-19 疗法可以提高这些分子识别和阻断这些病毒用来感染细胞的蛋白质的能力。(Hie 表示,COVID-19 抗体对 Omicron 及其亚变体无效,人工智能引导的变化不太可能恢复有效性。)

    Kim 说,许多建议的抗体变化发生在与其靶标相互作用的蛋白质区域之外,这通常是工程工作的重点。他补充说:「该模型所涉及的信息甚至对抗体工程专家来说都是完全不明显的……对我来说,这就是『天哪,这是怎么回事?』时刻。」


    「这是人们用来改善抗体的工具。」英国牛津大学免疫信息学研究员 Charlotte Deane 说,「我觉得这真的很酷。」 但她补充说,许多研究人员希望,生成式 AI 不是简单地改进现有抗体,而是能够创造出全新的抗体,这些抗体将与选定的目标结合。

    Nabla Bio 的联合创始人 Surge Biswas 说,这种能力可以帮助研究人员开发针对抵抗其他抗体设计方法的分子靶标的药物,该公司正在应对这一挑战。

    例如,人工智能可以帮助解决 G 蛋白偶联受体问题,G 蛋白偶联受体是夹在细胞膜中的一类蛋白质,与神经系统疾病、心脏病和无数其他疾病有关。Biswas 说,生成式 AI 还可以帮助设计能够锁定多个目标的抗体药物,例如设计肿瘤蛋白和可以杀死肿瘤的免疫细胞。

    斯坦福大学生物工程师 Possu Huang 表示,蛋白质语言模型功能强大,非常擅长优化现有蛋白质,包括抗体。但仅在蛋白质序列上训练的模型可能难以产生识别特定蛋白质的真正新抗体。

    研究人员表示他们正在取得进展。2023 年 3 月,位于华盛顿州温哥华的生物技术公司 Absci 的科学家们在 bioRxiv 发布的预印本中报告了他们所说的用 AI 制造新抗体的第一步。他们使用包含蛋白质序列和实验数据的模型,为用于治疗乳腺癌的抗体药物的几个重要区域生成了新设计。


  • 原文来源:https://www.nature.com/articles/s41587-023-01763-2
相关报告
  • 《前沿 | AI助力破解病毒密码,MIT团队开发新模型能更好地“猜”出抗体长啥样》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:胡思思
    • 发布时间:2025-01-08
    • 借助 AI 模型,研究人员在根据蛋白质序列预测蛋白质结构方面已经取得了巨大进步,然而,这种方法对于抗体却不是那么有效,部分原因是由于这种类型的蛋白质具有“高变异性”。 为了解决这个挑战,麻省理工学院的研究人员开发出一种新方法让模型能够更准确地预测抗体结构。通过这种方法,研究人员能够筛选出数百万种可能的抗体,从而确定可用于治疗 SARS-CoV-2 和其他传染病的抗体。 这项研究工作的领导者、麻省理工学院计算机科学与人工智能实验室(CSAIL)计算与生物学小组负责人、西蒙斯数学教授 Bonnie Berger 表示:“这种新方法可以在大量信息中更有效地找到重要的线索,并且可以帮助制药公司节省不必要的开支,避免用错误的药物进行昂贵的临床测试。” 这项新技术侧重对抗体高变异区进行建模,同时也具有分析个体抗体库的潜力,这将有助于研究对艾滋病毒等疾病具有超级反应能力的人的免疫反应,从而帮助弄清楚为什么他们的抗体能够有效地抵御病毒。 目前,这篇论文已经发表在 PNAS 上。Bryan Bryson 是这篇论文的共同通讯作者,他是麻省理工学院生物工程副教授,也是麻省总医院、麻省理工学院和哈佛大学拉贡研究所的成员;Rohit Singh(前 CSAIL 研究科学家,现任杜克大学生物统计学、生物信息学和细胞生物学助理教授)和 Chiho Im 是该论文的共同一作。此外,赛诺菲和苏黎世联邦理工学院的研究人员也为这项研究做出了贡献。 1. 高变异性建模 蛋白质由长链氨基酸组成,可以折叠成大量结构。近年来,研究人员使用 AlphaFold 等来预测这些结构变得更加容易。比如 ESMFold 和 OmegaFold 等都是基于大语言模型,这些模型最初是为了分析大量文本而开发的,其能够学习和预测语句中的下一个单词,同样的方法也适用于蛋白质序列,通过学习哪些蛋白质结构最有可能由不同模式的氨基酸组成。 然而,这种方法并不总是适用于抗体,尤其是针对抗体的高变异区。抗体通常具有 Y 形结构,这些高变异区位于 Y 形结构的尖端,负责检测并结合外源蛋白质(即抗原),而 Y 形结构的底部提供结构支撑并帮助抗体与免疫细胞相互作用。 高变异区的长度不尽相同,但通常不会超过 40 个氨基酸。据估计,通过改变这些氨基酸的序列,人体免疫系统可以产生多达 101? 种不同的抗体,从而确保身体能够对各种各样的潜在抗原做出反应。这些序列不像其他蛋白质序列那样受到进化限制,因此大语言模型很难“学会”准确预测其结构。 “大语言模型能够很好地预测蛋白质结构的部分原因是进化限制了这些序列,而模型可以解读这些限制的含义。这类似于通过查看句子中单词的上下文来学习语法规则,从而弄清楚它的含义。”Rohit Singh 表示。 为了对这些高变异区进行建模,研究人员创建了两个基于现有蛋白质大语言模型的模块:一个模块针对来自蛋白质数据库(PDB)中约 3,000 个抗体结构的高变异序列进行训练,使其能够了解哪些序列倾向于生成相似的结构;另一个模块基于约 3,700 个抗体序列与它们结合三种不同抗原的强度相关的数据进行训练。 这种计算模型称为“AbMap”,其可以根据氨基酸序列预测抗体结构和结合强度。为了证明该模型的实用性,研究人员用它来预测能够强烈中和 SARS-CoV-2 病毒刺突蛋白的抗体结构。 研究人员从一组被预测会与该靶点结合的抗体开始,然后通过改变高变异区产生数百万种变体,这种模型能够识别出最成功的抗体结构,比基于大语言模型的传统蛋白质结构模型更准确。 随后,研究人员采取了一些“额外步骤”,将抗体划分为具有相似结构的组。他们与赛诺菲的研究人员合作,从每个组中选择抗体进行实验测试。实验发现,82% 的抗体比模型中的原始抗体具有更好的结合强度。 研究人员指出,“在开发初期就能找到多种优质的候选抗体,可以帮助制药公司避免浪费大量资金去测试最终会失败的候选抗体。” “他们不想孤注一掷。他们不希望把所有的希望都放在一个抗体上,然后在临床前试验中发现它有毒性问题。相反,他们更愿意拥有一系列不错的选择,同时推进这些选项,这样如果其中一个出了问题还有其他备选方案。”Rohit Singh 说。 2. 比较抗体 基于这项技术,研究人员还尝试解决一些长期存在的难题,即为什么不同的人对感染的反应不同。例如,为什么有些人感染新冠病毒后病情更严重?为什么有些接触过艾滋病毒的人却不会被感染? 科学家们一直试图通过对个体免疫细胞进行单细胞 RNA 测序并进行比较来回答这些问题,这一过程被称为“抗体库分析”。先前的研究表明,来自不同两个人的抗体库重叠度可能只有 10%,然而,测序无法提供与结构信息一样全面的抗体“全景图谱”,因为具有不同序列的两种抗体也可能具有相似的结构和功能。 这种新模型可以通过快速生成个体中发现的所有抗体的结构来帮助解决这个问题。在这项研究中,研究人员发现,当考虑到抗体结构时,个体之间的重叠比序列比较中看到的 10% 要多得多。他们现在计划进一步研究这些结构如何促进人体针对特定病原体的整体免疫反应。 “大语言模型在这里发挥得非常好,因为它既能像基于序列的分析那样灵活扩展,又能达到基于结构的分析的准确性。”Rohit Singh 表示。 这项研究得到了赛诺菲和 Abdul Latif Jameel 健康机器学习诊所资助。
  • 《Supermicro推出三款生成式AI超级集群》

    • 来源专题:新一代信息技术
    • 编译者:isticzz2022
    • 发布时间:2024-03-26
    •       美超微宣布了其产品组合的最新补充,以帮助加速生成式人工智能的部署。美超微的SuperCluster解决方案旨在为大型语言模型(LLM)基础设施提供基础构建块,而三款新的美超微SuperCluster解决方案现已可用于生成式人工智能工作负载。4U液冷系统或8U风冷系统是专为强大的LLM训练性能、大批量和大规模LLM推理而设计的。       第三款SuperCluster采用1U风冷美超微NVIDIA MGXTM系统,已针对云规模推理进行了优化。美超微总裁兼首席执行官查尔斯·梁表示: “在人工智能时代,计算单元现在以集群为单位进行衡量,而不仅仅是服务器数量,而且凭借我们每月5000个机架的全球制造能力,我们可以比以往更快地向客户提供完整的生成式人工智能集群。一个64节点的集群通过几个可扩展的集群构建块,使用400Gb/s NVIDIA Quantum-2 InfiniBand和Spectrum-X以太网网络,使512个NVIDIA HGX H200 GPU和72TB HBM3e互连。美超微的SuperCluster解决方案与NVIDIA AI Enterprise软件相结合,旨在为企业和云基础设施提供培训当今LLM的高达数万亿参数的生成式人工智能和LLM的基础构建块。”       NVIDIA GPU产品管理副总裁Kaustubh Sanghani表示:“NVIDIA最新的GPU、CPU、网络和软件技术使系统制造商能够加速全球市场的一系列下一代AI工作负载。通过利用NVIDIA加速计算平台和基于Blackwell架构的产品,美超微正在为客户提供他们需要的、可以轻松部署在数据中心的最先进的服务器系统。”       Supermicro 4U NVIDIA HGX H100/H200 8-GPU系统通过使用液冷技术使8U风冷系统的密度翻倍,从而降低能耗并降低数据中心的总拥有成本。这些系统旨在支持下一代基于NVIDIA Blackwell架构的GPU。Supermicro的冷却分配单元(CDU)和流形(CDM)是将冷却液体分配到Supermicro的定制直接芯片(D2C)冷板的主要动脉,使GPU和CPU保持最佳温度,从而获得最佳性能。这种冷却技术使整个数据中心的电力成本降低40%,并节省数据中心的实际空间。配备NVIDIA HGX H100/H200 8-GPU的系统适用于训练生成AI。通过NVIDIA NVLink、高GPU内存带宽和容量的高速互连GPU是运行LLM模型的关键,具有成本效益。       Supermicro SuperCluster创建了一个巨大的GPU资源池,作为一个单一的AI超级计算机。据该公司称,无论是安装一个在数万亿个令牌的数据集上从头开始训练的巨大基础模型,还是构建一个云规模的LLM推理基础设施,具有非阻塞400Gb/s结构的脊柱和叶子网络拓扑都可以无缝地从32个节点扩展到数千个节点。Supermicro表示,采用NVIDIA MGX系统设计,以NVIDIA GH200 Grace Hopper Superchips为特色,将为未来的AI集群创建一个蓝图,解决生成AI的关键瓶颈——运行大型语言(LLM)模型的GPU内存带宽和容量,以降低运营成本。256个节点的集群使云规模的高容量推理能力成为可能,易于部署和扩展。       带有5个机架的4U液冷系统或9个机架的8U风冷系统的Supermicro SuperCluster在一个可扩展的单元中拥有256个NVIDIA H100/H200 Tensor Core GPU。液冷技术可实现512个GPU和64个节点的配置,与风冷256个GPU和32个节点的解决方案占用相同的空间。一个可扩展的单元中包含20TB的HBM3(采用NVIDIA H100)或36TB的HBM3e(采用NVIDIA H200)。1:1网络为每个GPU提供高达400 Gbps的带宽,以实现GPUDirect RDMA和存储,用于训练具有数万亿参数的大型语言模型。采用NVIDIA Quantum-2 InfiniBand和NVIDIA Spectrum-X以太网平台的400G InfiniBand或400GbE以太网交换机结构,具有高度可扩展的骨干叶网络拓扑。       NVIDIA AI Enterprise 5.0软件支持新的NVIDIA NIM推理微服务,可加速大规模AI模型的部署。采用9个机架中的1U风冷NVIDIA MGX系统的超级集群,在一个可扩展的单元中包含256个GH200 Grace Hopper Superchips。高达144GB的HBM3e + 480GB的LPDDR5X统一内存适用于云规模、高容量、低延迟和高批量推理,能够在一个节点中容纳70B+参数模型。采用400G InfiniBand或400GbE以太网交换机结构,具有高度可扩展的骨干叶网络拓扑。每个节点内含高达8个E1.S NVMe存储设备。采用NVIDIA BlueField-3 DPUs和行业领先的并行文件系统选项的可定制AI数据管道存储结构,为每个GPU提供高吞吐量和低延迟的存储访问。NVIDIA AI Enterprise 5.0软件。Supermicro的超级集群解决方案针对LLM训练、深度学习和高容量、高批量推理进行了优化。客户可以获得即插即用的可扩展单元,以便在数据中心轻松部署并更快地获得结果。