《美国Meta公司开发出可预测6亿蛋白质结构的新工具,预测速度可达AlphaFold的60倍》

  • 来源专题:生物安全
  • 编译者: 闫亚飞
  • 发布时间:2022-11-13
  • 据学术经纬公众号11月3日消息,美国Meta公司开发的ESMFold预测超6亿个蛋白质三维结构,包含大量前所未见的结构,预测速度最高可达AlphaFold的60倍。该团队将大量已知蛋白质的氨基酸序列输入大型语言模型进行监督学习训练,创建出迄今最大的蛋白质语言模型,可以原子分辨率预测蛋白质三维结构。相较基于多序列比对的AlphaFold,ESMFold仅基于氨基酸序列而不需额外信息就能进行结构预测,预测流程得到了简化,但其预测准确率不及前者。ESMFold对来自环境土壤、海水、人体肠道与皮肤及其他微生物样本进行了宏基因组DNA测序,两周时间预测出超6.17亿个蛋白质结构,其中至少2.25亿属可识别原子层面的高精度预测,并且76.8%与已知蛋白质结构存在显著差异,12.6%完全不匹配,即宏基因组中储存着大量前所未见的蛋白质结构。基于语言模型的ESMFold扩大了蛋白质结构数据库,为解读复杂、未知蛋白质以及探索新物种提供了更简洁、简单且廉价的工具。相关研究成果发表于biorxiv期刊。
  • 原文来源:https://mp.weixin.qq.com/s/Ac9qv0DbzWNA3PeXDF-f-g
相关报告
  • 《美国Meta公司开发出可预测6亿蛋白质结构的新工具,预测速度可达AlphaFold的60倍》

    • 来源专题:生物安全网络监测与评估
    • 编译者:闫亚飞
    • 发布时间:2022-11-24
    • 据学术经纬公众号11月3日消息,美国Meta公司开发的ESMFold预测超6亿个蛋白质三维结构,包含大量前所未见的结构,预测速度最高可达AlphaFold的60倍。该团队将大量已知蛋白质的氨基酸序列输入大型语言模型进行监督学习训练,创建出迄今最大的蛋白质语言模型,可以原子分辨率预测蛋白质三维结构。相较基于多序列比对的AlphaFold,ESMFold仅基于氨基酸序列而不需额外信息就能进行结构预测,预测流程得到了简化,但其预测准确率不及前者。ESMFold对来自环境土壤、海水、人体肠道与皮肤及其他微生物样本进行了宏基因组DNA测序,两周时间预测出超6.17亿个蛋白质结构,其中至少2.25亿属可识别原子层面的高精度预测,并且76.8%与已知蛋白质结构存在显著差异,12.6%完全不匹配,即宏基因组中储存着大量前所未见的蛋白质结构。基于语言模型的ESMFold扩大了蛋白质结构数据库,为解读复杂、未知蛋白质以及探索新物种提供了更简洁、简单且廉价的工具。相关研究成果发表于biorxiv期刊。
  • 《Nature | 超越蛋白质:AlphaFold3预测复杂生物分子结构》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-05-10
    • 2024年5月8日,谷歌Deep Mind的John M. Jumper通讯在Nature发表题为Accurate structure prediction of biomolecular interactions with AlphaFold 3的文章,推出了AlphaFold 3(AF3),能够超高精度预测各种生物分子复合物的结构。这一成就代表着我们理解和操纵控制生物系统的复杂相互作用的能力的重大飞跃。 在其前身AlphaFold 2的成功基础上,新模型引入了实质性的架构和训练程序增强,以适应更广泛的化学结构,并提高数据效率。AF3的核心是一种基于扩散的方法,该方法直接预测原始原子坐标,无需专门处理键合模式和立体化学约束。AF3的真正威力在于其在不同生物分子相互作用中的卓越准确性。值得注意的是,AF3在预测蛋白质配体、蛋白质核酸和抗体抗原相互作用方面优于专业工具,甚至超过了最先进的对接方法。这种准确性延伸到涉及蛋白质、核酸、小分子、离子和修饰残基的复杂结构。 AF3的关键优势之一是其准确模拟共价修饰的能力,如键合配体、糖基化以及修饰的蛋白质和核酸残基。这种能力对于理解生物学过程背后复杂的分子机制和开发有针对性的治疗干预措施至关重要。研究人员使用最近的接口特定基准(interface-specific benchmark)仔细评估了AF3的性能,证明其优于已知最先进的方法。此外,该模型的置信度测量密切跟踪其准确性,为研究人员提供了一个可靠的预测可靠性指标。 虽然AF3代表着向前迈出的一大步,但研究人员承认存在某些局限性。其中包括偶尔的立体化学侵犯(stereochemical violation),如手性误差和原子碰撞,以及准确预测动力学行为和构象状态的挑战。此外,对某些目标的高度准确的预测可能需要生成多个预测并对其进行排序,从而产生额外的计算成本。 尽管存在这些局限性,但AlphaFold 3的开发是生物分子结构预测领域的一项变革性成就。通过在统一的深度学习框架内对广泛的生物分子相互作用进行准确建模,AF3有望加速我们对细胞调节的理解,并为合理的治疗设计铺平道路。随着计算和实验方法继续并行发展,这些方法之间的协同作用无疑将推动我们进入一个前所未有的结构见解时代,开启生物学理解和治疗发展的新前沿。