《生成式 AI 如何构建更好的抗体》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-07-11
  • 抗体是免疫系统对抗感染的主要武器之一。这些蛋白质已成为生物技术行业的宠儿,部分原因是它们可以被设计成附着在几乎任何可以想象的蛋白质上,从而操纵其活动。但斯坦福大学的计算生物学家 Brian Hie 表示,生成具有有效特性的抗体并对其进行改进优化,涉及“大量的强力筛选”。

    为了了解生成式 AI 工具是否可以减少一些繁重的工作,Hie、Kim 团队使用了称为蛋白质语言模型的神经网络。这些类似于构成 ChatGPT 等工具基础的「大型语言模型」。但是,蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上进行训练。

    研究人员已经使用此类模型来设计全新的蛋白质,并帮助以高精度预测蛋白质的结构。Hie 的团队使用了一种蛋白质语言模型——由 Meta AI 的研究人员开发——来建议抗体的少量突变。

    在它学习的近 1 亿个蛋白质序列中,该模型只接受了几千个抗体序列的训练。尽管如此,该模型的建议中有惊人的高比例提高了针对 SARS-CoV-2、埃博拉病毒和流感的抗体与其目标结合的能力。

    改变批准用于治疗埃博拉病毒的疗法和 COVID-19 疗法可以提高这些分子识别和阻断这些病毒用来感染细胞的蛋白质的能力。(Hie 表示,COVID-19 抗体对 Omicron 及其亚变体无效,人工智能引导的变化不太可能恢复有效性。)

    Kim 说,许多建议的抗体变化发生在与其靶标相互作用的蛋白质区域之外,这通常是工程工作的重点。他补充说:「该模型所涉及的信息甚至对抗体工程专家来说都是完全不明显的……对我来说,这就是『天哪,这是怎么回事?』时刻。」

    「这是人们用来改善抗体的工具。」英国牛津大学免疫信息学研究员 Charlotte Deane 说,「我觉得这真的很酷。」 但她补充说,许多研究人员希望,生成式 AI 不是简单地改进现有抗体,而是能够创造出全新的抗体,这些抗体将与选定的目标结合。

    Nabla Bio 的联合创始人 Surge Biswas 说,这种能力可以帮助研究人员开发针对抵抗其他抗体设计方法的分子靶标的药物,该公司正在应对这一挑战。

    例如,人工智能可以帮助解决 G 蛋白偶联受体问题,G 蛋白偶联受体是夹在细胞膜中的一类蛋白质,与神经系统疾病、心脏病和无数其他疾病有关。Biswas 说,生成式 AI 还可以帮助设计能够锁定多个目标的抗体药物,例如设计肿瘤蛋白和可以杀死肿瘤的免疫细胞。

    斯坦福大学生物工程师 Possu Huang 表示,蛋白质语言模型功能强大,非常擅长优化现有蛋白质,包括抗体。但仅在蛋白质序列上训练的模型可能难以产生识别特定蛋白质的真正新抗体。

    研究人员表示他们正在取得进展。2023 年 3 月,位于华盛顿州温哥华的生物技术公司 Absci 的科学家们在 bioRxiv 发布的预印本中报告了他们所说的用 AI 制造新抗体的第一步。他们使用包含蛋白质序列和实验数据的模型,为用于治疗乳腺癌的抗体药物的几个重要区域生成了新设计。

相关报告
  • 《抵抗HIV的强效抗体成熟路径:从胚系细胞至HIV-1广泛中和性抗体》

    • 来源专题:艾滋病防治
    • 编译者:门佩璇
    • 发布时间:2016-03-07
    • HIV-1广泛中和性抗体一直是HIV/AIDS免疫学领域的研究热点,也是HIV疫苗研究的关键突破点。 2016年3月3日在线发表于CELL杂志上的一篇文章中,研究人员在一名HIV感染者体内追踪到了罕见的强效广泛中和性抗体,研究通过探讨它的系列结构,阐释了该抗体的形成与成熟路径。论文标题为:”Maturation Pathway from Germline to Broad HIV-1 Neutralizer of a CD4-Mimic Antibody”。 来自美国国家过敏与传染病研究所(National Institute of Allergy and Infectious Diseases, NIAID)疫苗研究中心和杜克大学医学院人类疫苗研究所等机构的研究人员于6年前开始追踪一名非洲HIV感染者,他在接受相应的HIV诊断与治疗时提供其血液标本,以便研究人员实时跟踪HIV病毒与体内免疫反应的共同进化。杜克大学医学院人类疫苗研究所的Mattia Bonsignori博士表示,在此之前,他们就曾追踪到该感染者体内一种广谱中和性抗体,但此次发现抗体的效价远远强于前者。研究人员主要通过高分辨率电子显微镜来观察这种结合到HIV包膜上的中和抗体,并构建结构模型来探讨中和性抗体与HIV病毒之间发生的复杂结构变化。 由于HIV病毒发生突变的速度极快,研究广泛中和性HIV抗体对于HIV疫苗的开发具有深远的意义。尤其是从慢性HIV感染者体内分离得到的中和抗体,将有可能通过促进其在健康者体内的产生来抵御HIV病毒感染,从而为疫苗研发提供新的指导意见。 目前该课题组正在进一步研究体内免疫系统是如何对抗广谱中和性抗体的大量产生的。
  • 《从 ChatGPT 看生成式 AI 对情报学研究与实践的影响》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-07-11
    • 一般地,情报学理论范式指导情报实践工作。有研究将情报学理论范式分为 4 种,并阐释了每种范式下的情报工作重点和发展趋向,分别是:泛信息论范式下的知识管理与综合性知识服务;学术信息服务范式下的信息检索与服务;决策情报服务范式下的战略情报支持;社会信息服务范式下的企业 竞争情报、社会情报、舆情传播等。鉴于这4种范式较为全面地覆盖了情报实践工作的内容,因此本文将以此为视角,分析生成式AI将对情报实践产生的影响。 1.  拓宽知识资源建设渠道,打造知识服务新生态 知识服务是各类情报机构的一项重要职能,而智慧型知识服务是人工智能时代的产物。生成式AI又将推进智慧型知识服务向高级阶段的进化。从知识生产层面,传统的知识资源多出自出版社、数据库商以及情报机构的自建数据库和知识库。生成式AI的出现将拓宽情报机构知识资源建设的渠 道,AI辅助用户内容创作、AI自动生成内容成为 新的知识生产模式。一方面,每个用户可参与到知 识生产过程中,通过AI辅助获取知识创作的灵感、素材,由AI生成文本、图像、代码、3D模型等多模态知识,实现内容续写、跨模态内容生成( 文字 合成图片或视频等),可极大提升用户体验;另一 面,生成式AI能够通过学习数据的底层模式再自动生成新内容。但就目前最先进的生成式AI技术ChatGPT而言,一大特点就是无法保证生成内容的准确性,这与知识的属性相斥。近期发表在Nature上的文章《ChatGPT:五大优先研究问题》中,研究者指出,ChatGPT 被用于科学界,必须要 坚持人类审查的原则。这无疑对情报机构提出 了新的挑战,即缺少前端的专家审核,情报机构需要承担对AI生成知识内容的人工审核与质量把控 的任务。从知识服务层面,随着元宇宙概念的提 出,情报服务机构致力于构建结合 AR、VR、人工智能等技术的超现实空间与现实空间融合的虚实共生的知识服务场景,而生成式 AI 技术也将为此贡献巨大力量,比如利用AIGC生成虚拟人或数字人,利用“ChatGPT+虚拟人”技术打造人机交互新入口,为用户提供沉浸式、立体化知识体验,有助于拓宽情报机构知识服务的范畴,构建知识服务新生态。 2.  塑造学术信息检索新范式,优化学术信息服务模式 ChatGPT的出现对搜索引擎业务构成了较大威胁,但百度指出生成式AI并不能替代搜索引擎,两者是一种互补的关系,并提出了融合两者功能的“生成式搜索”概念,这对情报领域的学术信息搜索发出了信号。一方面,针对以 Web of Science、中国知网、情报机构自建知识库等为代表的学术信息搜索平台,如果借鉴ChatGPT与WebGPT的联动效应,将生成式AI整合至学术搜索平台中,使其实时根据数据库内容更新,生成的内容参考了某篇学术论文则注明其来源。用户关于某一研究主题 得到的检索结果将不仅是文献列表,也能呈现由生成式AI筛选、整合、总结生成的文献综述,又或是根据读者描述的研究思路,基于对海量文献中图表、图像数据的学习,生成技术路线图以供参考,甚至是针对某领域的研究成果,利用生成式AI抽取细粒度知识,自动生成学术知识图谱,把复杂的关 联研究直观地呈现给读者,以交互式问答方式回答读者的问题,并通过连续对话提升读者体验;另一方面,对于学术科研互动社区,生成式AI在学习了 科研用户海量的问答数据之后,可针对用户搜索或提问生成答案。由此可以预测,生成式 AI 将会重塑 学术信息检索新范式,有助于优化信息服务模式, 但其能力边界与训练时被投喂的数据数量、质量、丰富度有很大关系,这将是情报实践工作中着重考 虑的问题。此外,最重要的是,基于 AI 的学术信息 服务需在明确的使用规范前提下开展,避免被错误和虚假信息误导而产生学术不端等后果,这一问题 正是当前学术圈讨论的热点。 3.  挑战决策情报服务体系,驱动情报效能提升 决策支持服务是情报工作的一项重要内容,主要面向国家科技战略、产业发展与产业结构政策、学科发展等战略决策型关键问题,通过文本挖掘、科学计量等方法深度剖析科技发展态势、学科演化、政策布局,形成战略咨询报告。ChatGPT 发布 以后,被尝试用于生成行业分析报告、市场调研报 告等。其使用了来自人类反馈的强化学习方案,具备良好的思维链能力,能够针对特定问题自主生成解决方案。虽然从目前来看,生成的报告内容仍然 不够专业可信,并不能直接用于指导决策,但随着不断地反馈学习以及模型算法的优化,性能会极大地提升。这对面向决策支持的情报服务产生了较大的冲击和挑战,然而并不会完全取代情报人员的工作,而是作为辅助工具加速推进决策支持服务的智能化,驱动情报效能的提升。因为,即便是在Zero-shot设置下执行下游任务,也需要向AI输入提示。换言之,在决策支持服务中,最基本也是最重 要的环节是情报分析对象、方向、预期的情报产物 形式与内容(比如战略报告的框架)的确定,生成 式AI仅作为辅助情报分析与内容生成的工具,前提是情报人员向其输入合适的问题,这意味着情报人员需要对用户需求有深刻的理解并承担情报产品 的设计工作。从另一方面来看,生成式AI有助于将情报人员从琐碎的分析、撰写任务中解放出来,更多地投入创新性研究工作中。比如,在利用科学计量学分析方法辅助制定科技发展战略规划时,AI可以依据已有的理论和方法,针对特定问题基于数据挖掘生成分析报告,但探索计量学新理论、新律,具体到更加科学有效的新的指标体系构建等创造性工作中,仍然需要专业人员的深入研究和持续创新。 4.  增加社会信息服务压力,凸显情报价值引领 在社会信息服务范式下,情报工作在企业竞争情报服务、安全情报服务、舆情风险预警与治理、数据治理等领域发挥着重要作用。生成式AI在赋能情报收集、处理与分析的同时,也会带来一系列负面影响,增加情报服务的压力。比如,在社会安全和舆情治理方面,ChatGPT可能会成为谣言制造者或舆论引导者的辅助工具,在一些误导性、充斥阴谋论的提问下大量改编信息,引导社会舆论向片 面、极端的方向发展。这在一定程度上会加大风险的情报感知与情报预警的难度。在数据治理方面,近年来关于科研大数据治理、企业大数据治理、政府大数据治理等问题愈发重要,治理的维度涉及数据安全、数据标准、数据质量等。伴随着 ChatGPT等生成式AI的快速发展,海量AI生成数据涌向经济、科研、政务等各个领域,由此带来的数据治理 压力是巨大的。从生成式AI模型的工作原理来看,生成数据的质量取决于训练时被投喂的数据质量和输入提示的有效性。因此,数据治理不仅涉及到AI创造的内容,同样涉及训练数据和提示数据。可以预见,情报学在数据治理领域将面临较大挑战,具体包括AI生成数据的质量管理、标准化、数据归类、数据产权归属等各类问题。然而,从另一个角度来看,生成式AI在增加社会情报服务压力的同时,也更加凸显情报的价值和社会效用,如 何充分发挥情报在综合研判、监测预警、信息汇聚 与治理等方面的作用,更好地服务社会发展,是情报工作在AI冲击下保持优势地位的关键。