2024年4月19日,华盛顿大学David Baker通讯在Science发表题为Generalized biomolecular modeling and design with RoseTTAFold All-Atom的文章,发明了一种突破性的计算工具,称为RoseTTAFold All Atom(RFAA)。RFAA超越了多肽链限制,涵盖了整个生物分子系统的复杂性和多样性,包括蛋白质、核酸、小分子、金属离子和各种共价修饰。
该团队通过将氨基酸和DNA碱基的基于残基的表示与其他化学实体的综合原子表示相结合,开发了RFAA。这种混合方法允许基于输入序列和化学结构对复杂的生物分子组件进行建模。作者通过对去噪任务进行微调来细化RFAA,从而创建了RFdiffusion All Atom(RFdiffusionAA),能够产生专门容纳感兴趣的小分子的de novo蛋白质结构。在预测蛋白质小分子复合物方面,与现有方法相比,即使不依赖于已知的天然结构或预定义的模板,RFAA也表现出了非凡的性能。研究人员让RFAA服务器参与了连续自动模型评估(CAMEO)计划,证明了其对蛋白质数据库(PDB)中新的蛋白质结构的盲配体对接预测的熟练程度。
RFAA的一个显著成就在于它能够预测共价修饰蛋白质的结构,这是理解生物过程的功能含义和机制的关键方面。此外,该团队探索了具有挑战性的从头小分子粘合剂设计领域——这项任务传统上是通过将分子对接到现有的蛋白质支架中或使用基于扩散的方法来完成的。RFdiffusionAA通过学习生成具有针对非蛋白质靶标的优化相互作用谱的蛋白质,从而克服了早期技术的局限性,这些技术没有明确地模拟蛋白质-配体相互作用,从而开创了新的局面。
为了验证这一新设计策略的有效性,作者为各种配体创建了小分子结合蛋白,包括心脏药物地高辛(digoxigenin)、酶辅因子血红素(heme)和具光学活性的后色胆素(bilin)分子。晶体学分析证实了所设计的粘合剂的保真度,其中一种血红素结合蛋白在预测结构和实验结构之间表现出令人印象深刻的均方根偏差(RMSD):仅为0.86?。
总之,这些实验表征强调了RFAA和RFdiffusionAA在创造量身定制的生物分子相互作用方面的实用性,可能为合理设计新的治疗方法和生物传感器铺平道路。虽然预测精度仍有进一步提高的空间,但这项工作标志着生物分子建模和设计领域的重大飞跃。作者提供了一个统一而通用的平台,有望提升我们在广泛应用中设计复杂生物系统的能力。