《Nature | Cryo-em图中的自动模型构建和蛋白质识别 》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2024-02-29
  • 2024年2月26日,剑桥大学等机构的研究人员在Nature发表题为Automated model building and protein identification in cryo-EM maps的文章。

    用原子模型解释电子冷冻显微镜 (cryo-em) 图需要高水平的专业知识和对三维计算机图形程序的劳动密集型手动干预。

    该研究介绍了ModelAngelo,这是一种用于在cryo-em地图中自动构建原子模型的机器学习方法。通过将来自cryo-em图的信息与来自单个图形神经网络中的蛋白质序列和结构的信息相结合,ModelAngelo为与人类专家生成的蛋白质质量相似的蛋白质建立了原子模型。

    对于核苷酸,ModelAngelo构建的骨架具有与人类相似的准确性。通过在隐马尔可夫模型序列搜索中使用每个残基的预测氨基酸概率,ModelAngelo在识别具有未知序列的蛋白质方面胜过人类专家。因此,ModelAngelo将消除瓶颈并提高cryo-em结构确定的客观性。

相关报告
  • 《Diffusion模型助力更强的蛋白质从头设计》

    • 来源专题:战略生物资源
    • 编译者:郭文姣
    • 发布时间:2023-09-08
    •     2023年7月11日,David Baker课题组在Nature上发表了一篇题为"De novo design of protein structure and function with RFdiffusion"的研究论文,该论文描述了一种能设计新蛋白质的深度学习方法,名为RoseTTAFold Diffusion(RFdiffusion)。该方法能生成各种功能性蛋白质,包括在天然蛋白质中从未见过的拓扑结构。 编译来源:https://mp.weixin.qq.com/s/JQo6__4VEnvjKQ9-vfb-LQ
  • 《Nature | 用可编程生成模型照亮蛋白质空间》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2023-11-20
    • 本文内容转载自“ CNS推送BioMed”微信公众号。原文链接: https://mp.weixin.qq.com/s/h2bfRORefRZYwtO9svZ6fA 2023年11月15日,Generate Biomedicines的研究人员在 Nature 期刊发表了题为Illuminating protein space with a programmable generative model的研究论文。 30亿年的进化产生了极其多样的蛋白质分子,但蛋白质的全部潜力可能要大得多。利用这种潜力对计算和实验来说都是一个挑战,因为可能的蛋白质分子的空间比那些可能具有功能的分子的空间要大得多。 该研究介绍了Chroma,这是一种蛋白质和蛋白质复合物的生成模型,可以直接对新的蛋白质结构和序列进行采样,并且可以调节以引导生成过程向所需的性质和功能方向发展。为了实现这一点,研究人员引入了一种尊重聚合物整体构象统计的扩散过程,一种有效的分子系统神经结构,可以通过亚二次尺度进行远程推理,通过预测残基间几何形状有效合成蛋白质三维结构的层,以及一种用于扩散模型的通用低温采样算法。 Chroma通过外部约束下的贝叶斯推理来实现蛋白质设计,这些约束可以涉及对称性、子结构、形状、语义甚至自然语言提示。310种蛋白质的实验表征表明,从Chroma取样得到的蛋白质高度表达、折叠并具有良好的生物物理特性。设计的两种蛋白质的晶体结构与Chroma样品表现出原子一致性(主干均方根偏差约为1.0 a)。通过这种统一的蛋白质设计方法,研究人员希望加速蛋白质物质的编程,以造福人类健康,材料科学和合成生物学。