《Science | 预测共价修饰、小分子的蛋白质结构》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2024-04-24
  • 2024年4月19日,华盛顿大学David Baker通讯在Science发表题为Generalized biomolecular modeling and design with RoseTTAFold All-Atom的文章,发明了一种突破性的计算工具,称为RoseTTAFold All Atom(RFAA)。RFAA超越了多肽链限制,涵盖了整个生物分子系统的复杂性和多样性,包括蛋白质、核酸、小分子、金属离子和各种共价修饰。

    该团队通过将氨基酸和DNA碱基的基于残基的表示与其他化学实体的综合原子表示相结合,开发了RFAA。这种混合方法允许基于输入序列和化学结构对复杂的生物分子组件进行建模。作者通过对去噪任务进行微调来细化RFAA,从而创建了RFdiffusion All Atom(RFdiffusionAA),能够产生专门容纳感兴趣的小分子的de novo蛋白质结构。在预测蛋白质小分子复合物方面,与现有方法相比,即使不依赖于已知的天然结构或预定义的模板,RFAA也表现出了非凡的性能。研究人员让RFAA服务器参与了连续自动模型评估(CAMEO)计划,证明了其对蛋白质数据库(PDB)中新的蛋白质结构的盲配体对接预测的熟练程度。

    RFAA的一个显著成就在于它能够预测共价修饰蛋白质的结构,这是理解生物过程的功能含义和机制的关键方面。此外,该团队探索了具有挑战性的从头小分子粘合剂设计领域——这项任务传统上是通过将分子对接到现有的蛋白质支架中或使用基于扩散的方法来完成的。RFdiffusionAA通过学习生成具有针对非蛋白质靶标的优化相互作用谱的蛋白质,从而克服了早期技术的局限性,这些技术没有明确地模拟蛋白质-配体相互作用,从而开创了新的局面。

    为了验证这一新设计策略的有效性,作者为各种配体创建了小分子结合蛋白,包括心脏药物地高辛(digoxigenin)、酶辅因子血红素(heme)和具光学活性的后色胆素(bilin)分子。晶体学分析证实了所设计的粘合剂的保真度,其中一种血红素结合蛋白在预测结构和实验结构之间表现出令人印象深刻的均方根偏差(RMSD):仅为0.86?。

    总之,这些实验表征强调了RFAA和RFdiffusionAA在创造量身定制的生物分子相互作用方面的实用性,可能为合理设计新的治疗方法和生物传感器铺平道路。虽然预测精度仍有进一步提高的空间,但这项工作标志着生物分子建模和设计领域的重大飞跃。作者提供了一个统一而通用的平台,有望提升我们在广泛应用中设计复杂生物系统的能力。

相关报告
  • 《Nature | 超越蛋白质:AlphaFold3预测复杂生物分子结构》

    • 编译者:李康音
    • 发布时间:2024-05-10
    • 2024年5月8日,谷歌Deep Mind的John M. Jumper通讯在Nature发表题为Accurate structure prediction of biomolecular interactions with AlphaFold 3的文章,推出了AlphaFold 3(AF3),能够超高精度预测各种生物分子复合物的结构。这一成就代表着我们理解和操纵控制生物系统的复杂相互作用的能力的重大飞跃。 在其前身AlphaFold 2的成功基础上,新模型引入了实质性的架构和训练程序增强,以适应更广泛的化学结构,并提高数据效率。AF3的核心是一种基于扩散的方法,该方法直接预测原始原子坐标,无需专门处理键合模式和立体化学约束。AF3的真正威力在于其在不同生物分子相互作用中的卓越准确性。值得注意的是,AF3在预测蛋白质配体、蛋白质核酸和抗体抗原相互作用方面优于专业工具,甚至超过了最先进的对接方法。这种准确性延伸到涉及蛋白质、核酸、小分子、离子和修饰残基的复杂结构。 AF3的关键优势之一是其准确模拟共价修饰的能力,如键合配体、糖基化以及修饰的蛋白质和核酸残基。这种能力对于理解生物学过程背后复杂的分子机制和开发有针对性的治疗干预措施至关重要。研究人员使用最近的接口特定基准(interface-specific benchmark)仔细评估了AF3的性能,证明其优于已知最先进的方法。此外,该模型的置信度测量密切跟踪其准确性,为研究人员提供了一个可靠的预测可靠性指标。 虽然AF3代表着向前迈出的一大步,但研究人员承认存在某些局限性。其中包括偶尔的立体化学侵犯(stereochemical violation),如手性误差和原子碰撞,以及准确预测动力学行为和构象状态的挑战。此外,对某些目标的高度准确的预测可能需要生成多个预测并对其进行排序,从而产生额外的计算成本。 尽管存在这些局限性,但AlphaFold 3的开发是生物分子结构预测领域的一项变革性成就。通过在统一的深度学习框架内对广泛的生物分子相互作用进行准确建模,AF3有望加速我们对细胞调节的理解,并为合理的治疗设计铺平道路。随着计算和实验方法继续并行发展,这些方法之间的协同作用无疑将推动我们进入一个前所未有的结构见解时代,开启生物学理解和治疗发展的新前沿。
  • 《大数据方法预测蛋白质结构》

    • 来源专题:转基因生物新品种培育专项服务
    • 编译者:Zhao
    • 发布时间:2017-02-16
    • 蛋白质的结构决定其功能。 实验蛋白结构测定是繁琐和昂贵的,这已经驱动了从序列信息预测蛋白质结构的方法的探索。(1) 约一半的已知蛋白质适于比较模拟; 也就是说,已知结构的正在演化中的相关蛋白可以用作模拟未知结构的样本。 对于剩余的蛋白质,没有发现令人满意的解决方案。(2)最近开发的方法用于预测蛋白质氨基酸接触与微生物DNA的宏基因组学的蛋白质序列组合以计算622个蛋白质家族的可靠模型,并且发现了100多个新的折叠。 宏基因组学数据的快速增长能够使更多的蛋白家族的结构预测变得更可靠。