《MBZUAI研发细胞形态预测AI模型 可凭基因数据生成高保真显微镜图像》

  • 来源专题:新一代信息技术
  • 编译者: 刘飞
  • 发布时间:2025-10-18
  • 阿联酋穆罕默德·本·扎耶德人工智能大学研究团队在《自然·通讯》发表新型扩散模型MorphDiff,能够仅凭L1000基因表达数据即可生成药物或基因编辑后的细胞形态图像。该模型在机制作用检索任务中表现优异,较基准方法提升16.9%,为药物发现提供高效的"虚拟显微镜"筛选方案。

    传统上,预测细胞形态变化需要大量的试验和高昂的成本,而MorphDiff通过转录组数据直接生成细胞“术后”图像,从而预览细胞形态。 MorphDiff是一种扩散模型,它利用基因表达模式(L1000数据)来指导形态生成。该模型学习已知的基因表达和细胞形态的对应关系,然后仅使用L1000基因表达数据作为条件生成逼真的扰动后图像。这些图像可以通过两种方式生成:从零开始或通过转换对照图像。

    研究表明,MorphDiff在大规模药物和遗传数据集上的表现与真实图像相当,并且在机制作用(MOA)检索上有优势。 该研究基于一个生物学观察:基因表达最终决定了显微镜下细胞的形态。虽然这种映射不是一一对应的,但共享的信号足够用于学习。使用转录组数据还有一个实际优势:公开的L1000数据远多于配对的形态数据,使得覆盖广泛的扰动空间成为可能。当有新的化合物出现时,其基因特征可以被MorphDiff利用。 MorphDiff内部结合了两个部分:首先是形态变分自编码器(MVAE),用于捕捉形态变化的多样性和生成高质量的图像。这一创新方法有望显著减少实验成本并加速细胞形态研究的进展。

  • 原文来源:https://spectrum.ieee.org/genai-morphdiff-drug-discovery
相关报告
  • 《Cell丨从蛋白质图像中机器学习可解释的细胞力学模型》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-01-10
    • 2024年1月8日,芝加哥大学詹姆斯-弗兰克研究所的科研人员在Cell上发表了题为Machine learning interpretable models of cell mechanics from protein images的研究论文。 细胞的形态和功能源于细胞质内复杂的机械化学系统。目前,还没有系统的策略可以从细胞的分子成分推断出细胞的大规模物理特性。这是理解细胞粘附和迁移等过程的障碍。 该研究开发了一个数据驱动的建模管道来学习粘附细胞的机械行为。作者首先训练神经网络,从细胞骨架蛋白的图像中预测细胞力。令人吃惊的是,单个焦点粘附(FA)蛋白(如zyxin)的实验图像就足以预测作用力,并能推广到未见过的生物机制。利用这一观察结果,作者开发了两种方法--一种受物理学制约,另一种则与物理学无关--来构建数据驱动的细胞力连续模型。这两种方法都揭示了细胞力是如何被两种不同的长度尺度编码的。除了粘附细胞力学,作者的工作还可作为将神经网络整合到细胞生物学预测模型中的案例研究。
  • 《美科学家开发DNA显微镜 可显示基因组信息》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2019-06-24
    • 在一项新的研究中,美国布罗德研究所生物物理学家Joshua Weinstein、霍华德-休斯医学研究所研究员Aviv Regev和麻省理工学院分子生物学家Feng Zhang发明了一种非传统的称为“DNA显微镜(DNA microscopy)”的成像方法,它能够观测到细胞在基因组水平上发生了什么。他们使用DNA“条形码”来协助确定分子在样本中的相对位置,而不依赖于光线(或者任何类型的光学器件)。相关研究结果于2019年6月20日在线发表在Cell期刊上,论文标题为“DNA Microscopy: Optics-free Spatio-genetic Imaging by a Stand-Alone Chemical Reaction”。 Weinstein说,通过使用DNA显微镜,这些研究人员能够构建细胞图像,同时获得大量的基因组信息。“这为我们提供了另一层我们无法观察到的生物学。” Regev说,“这是一种全新的显微镜类别。这不仅仅是一种新技术,而是一种我们以前从未考虑过要做的事情。” 新玩意 到目前为止,显微镜分为两大类。第一类是基于光学;比如,光学显微镜可追溯到17世纪,依靠可见光来照射样本。科学家们对这种方法进行了反复研究,甚至不再局限于可见光谱。电子显微镜、荧光显微镜和光片显微镜---它们的工作原理都是样本发射光子或电子,随后显微镜检测发射出的光子或电子。 第二类是在显微镜确定的位置上分割样本。然后,计算机程序将每个分割的片段拼接成完整样本的完整图片。光学成像可以提供亚细胞结构和作用的复杂图像。基于分割的显微镜可以为科学家提供遗传信息。 Weinstein和他在麻省理工学院的同事们想要构建一种一次性完成所有这一切---拍摄细胞位置的快照并找出驱动它的特定基因序列---的方法。 这种组合对于研究细胞遗传多样性的科学家来说非常重要。Weinstein说,免疫系统就是一个很好的例子。免疫细胞中的基因可发生最少单个碱基变化的变异。每种变异可引起细胞产生的抗体类型出现显著变化。细胞位于组织内部的位置也能够改变抗体产生。 他说,如果你专注于其中的一种变异,那么“你仅了解其中的一部分”。 它是如何发挥作用的? Regev说,捕获完整的细胞图片并不需要昂贵的显微镜或许多花哨的设备。所有你开始需要的是标本和移液器。 首先,这些研究人员获取实验室中培养的细胞,并将它们固定在反应室中。然后,他们添加了各种各样的DNA条形码。这些DNA条形码结合RNA分子,从而给每个RNA分子一个独特的标签。接下来,他们使用化学反应来让每个标记分子产生越来越多的拷贝---一个从每个分子的原始位置扩展出来的生长堆(growing pile)。 Weinstein说道,“将每个分子想象为一个向外传播自己信号的无线电塔。” 最终,标记的分子与其他标记的分子碰撞,迫使它们成对连接在一起。彼此靠近的分子更容易碰撞,因而产生更多的成对DNA。距离相隔较远的分子将产生较少的成对DNA。 DNA测序仪会读取样品中每个分子的碱基序列,这需要长达30个小时。这些研究人员开发出的算法随后解码这些数据---在本文中,这些数据代表来自每个原始样本的基因序列的大约5000万个DNA碱基---并将原始数据转换为图像。 Weinstein 说,“你基本上能够完全重建你在光学显微镜下看到的东西。” 他补充说,这两种方法是互补的。光学显微镜可以很好地观察到分子,即使它们在样品中是稀少的,而当分子密集---甚至彼此堆积在一起时,DNA显微镜表现更好。 他认为DNA显微镜有朝一日可能能够让科学家们加快开发帮助患者免疫系统对抗癌症的免疫疗法。他说,这种方法可能潜在地识别出最适合靶向特定癌细胞的免疫细胞。 Zhang说,每个细胞都有独特的DNA碱基组成。“通过直接从被研究的分子中获得信息,DNA显微镜开辟了一种将基因型与表型关联在一起的新方法。” Regev补充道,这类显微镜的可能性应用是非常广泛的。“我们希望它能激发人们的想象力,让他们受到我们从未想过的伟大想法的启发。”