2023年9月13日,Nature 期刊同期发表了两篇研究论文,这两项研究利用AlphaFold蛋白质结构数据库,让我们得以探索此前未知的蛋白质宇宙,通过分析比较蛋白质结构,发现了蛋白质中前所未见的新形状,揭示了蛋白质之间意想不到的联系,给黑暗中的“蛋白质宇宙”带来光亮。
对首尔国立大学的计算生物学家 Martin Steinegger 来说,他感兴趣的是绘制整个数据库中蛋白质之间的关系。为了实现这一目标,他与苏黎世联邦理工学院的计算生物学家 Pedro Beltrao 合作,他们开发了一种基于结构对齐的聚类算法——Foldseek cluster,可以根据蛋白质形状的相似性,快速比较AlphaFold蛋白质结构数据库中的每个结构。使用这一新算法,他们在AlphaFold蛋白质结构数据库中识别了230多万个形状相似的蛋白质簇。该研究以:Clustering-predicted structures at the scale of the known protein universe 为题,发表在了 Nature 期刊上。
来自巴塞尔大学的 Joana Pereira 和 Torsten Schwede 等人采用了一种略有不同的方法来阐明蛋白质宇宙中的暗物质。这项研究强调了大规模工作在识别、注释和确定新蛋白家族方面的价值。通过利用蛋白质生物信息学中最近的深度学习的革命性进展,我们能够以前所未有的规模揭示蛋白质宇宙的未知领域,为生命科学和生物技术的创新铺平道路。该研究以:Uncovering new families and folds in the natural protein universe 为题,发表在了 Nature 期刊上。
本文内容转载自“生物世界”微信公众号。原文链接: https://mp.weixin.qq.com/s/IFCXBqvYRC_J-IsqH5X7jA