本文内容转载自“ CNS推送BioMed”微信公众号。原文链接: https://mp.weixin.qq.com/s/h2bfRORefRZYwtO9svZ6fA
2023年11月15日,Generate Biomedicines的研究人员在 Nature 期刊发表了题为Illuminating protein space with a programmable generative model的研究论文。
30亿年的进化产生了极其多样的蛋白质分子,但蛋白质的全部潜力可能要大得多。利用这种潜力对计算和实验来说都是一个挑战,因为可能的蛋白质分子的空间比那些可能具有功能的分子的空间要大得多。
该研究介绍了Chroma,这是一种蛋白质和蛋白质复合物的生成模型,可以直接对新的蛋白质结构和序列进行采样,并且可以调节以引导生成过程向所需的性质和功能方向发展。为了实现这一点,研究人员引入了一种尊重聚合物整体构象统计的扩散过程,一种有效的分子系统神经结构,可以通过亚二次尺度进行远程推理,通过预测残基间几何形状有效合成蛋白质三维结构的层,以及一种用于扩散模型的通用低温采样算法。
Chroma通过外部约束下的贝叶斯推理来实现蛋白质设计,这些约束可以涉及对称性、子结构、形状、语义甚至自然语言提示。310种蛋白质的实验表征表明,从Chroma取样得到的蛋白质高度表达、折叠并具有良好的生物物理特性。设计的两种蛋白质的晶体结构与Chroma样品表现出原子一致性(主干均方根偏差约为1.0 a)。通过这种统一的蛋白质设计方法,研究人员希望加速蛋白质物质的编程,以造福人类健康,材料科学和合成生物学。