《深度学习准确预测蛋白质折叠方式》

  • 来源专题:生物科技领域知识集成服务
  • 编译者: 陈方
  • 发布时间:2020-09-11
  • 生命必需的基本生物过程几乎都是由蛋白质完成的。蛋白质由长长的氨基酸链通过折叠成精确的三维结构来实现功能,阐明蛋白质结构是所有分子生物学研究的重点。近年来,计算方法在基于氨基酸序列预测蛋白质折叠方面取得了重大进展。如果完全实现,这些方法有可能改变生物医学研究的几乎所有方向。然而,目前的方法在预测蛋白质的规模和范围方面还受到限制。
    2019年4月24日Cell Systems报道,哈佛医学院系统生物学家Mohammed AlQuraishi利用深度学习来预测基于氨基酸序列的蛋白质的三维结构,其精确度可与目前最先进的方法相媲美,但速度提高了100万倍。
    该研究用到的所谓的端到端可微深度学习,涉及到一个单一的、庞大的数学函数,它被形容为一个神经网络,网络的每个组成部分向前和向后提供信息。这个功能可以以难以想象的复杂程度一遍又一遍地调整自己,以准确地解析蛋白质序列在数学上是如何与其结构相互关联的。研究者发现,在预测没有预先存在模板的蛋白质结构方面,新模型优于所有其他方法,包括使用共同进化数据的方法。当用预先存在的模板来进行预测时,它的性能也比所有方法都好。更可喜的是,新模型的预测速度比现有的计算方法快6到7个数量级。训练这个模型可能需要几个月的时间,但一旦训练成功,它可以在几毫秒内做出预测,而使用其他方法需要几小时到几天的时间。
    研究者表示,这个新模型还没有准备好用于药物发现或设计,因为它的精确度目前处于6埃左右——距离解析蛋白质的完整原子结构所需的1至2埃仍有一段距离。有很多方案可以用于优化这种模型,包括进一步整合化学和物理的规则等。
    吴晓燕 编译自https://phys.org/news/2019-04-deep-learning-approach-protein-amino-acid.html
    原文链接:https://www.sciencedirect.com/science/article/pii/S2405471219300766?via%3Dihub
    原文标题:End-to-End Differentiable Learning of Protein Structure

相关报告
  • 《深度学习助力蛋白的设计》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2020-09-11
    • 蛋白设计通常有两种方法:“定向进化”是指随机改变编码天然蛋白质的氨基酸构件的基因序列,筛选具有所需活性的变体;“合理设计”是根据蛋白质3D结构对其进行建模,以识别可能影响蛋白质功能的氨基酸。然而,定向进化只能触及庞大数量蛋白质序列中的一小部分,而合理设计则需要对蛋白质3D结构进行艰难的解析。 2019年10月21日Nature Methods报道,哈佛大学Wyss生物启发工程研究所和哈佛医学院的研究人员创建了第三种蛋白质设计方法,利用深度学习直接从氨基酸序列中预测蛋白质基本特征。研究结果显示,该方法准确地预测了天然和从头设计的蛋白质功能,将大量工作转移给计算机,与现有方法相比,可将成本降低两个数量级。 研究人员将这个神经网络方法命名为“统一表示”(unified representation,UniRep),在大约三周的时间内,研究者对UniRep进行了约2400万个蛋白质序列的训练,以关联蛋白质序列及其特性,包括蛋白质稳定性、二级结构以及蛋白质内部序列对周围溶剂的可及性等。结果UniRep准确地描述了来自不同的蛋白质家族的蛋白质的这些特征,包括那些已经被研究清晰解析的蛋白质,以及自然界中不存在的蛋白质。 该团队进一步将UniRep作为研究工具,预测单个氨基酸取代如何影响蛋白质功能。该神经网络以多种生物学功能(包括酶催化、DNA结合、分子传感)可靠地预测8种不同蛋白质中单个氨基酸突变影响。此外,研究者使用绿色荧光蛋白作为模型,利用UniRep分析了该蛋白的64,800个变异体,每个变异体带有1~12个突变,结果UniRep准确地预测了突变的分布及其对蛋白质亮度的影响。 研究者表示,这种基于深度学习的蛋白质工程计算方法具有加速合成蛋白质设计的潜力,该方法可以针对任何所需应用量身定制蛋白质功能,可用于治疗、诊断、生物制造、生物催化及其他应用。 吴晓燕 编译自https://phys.org/news/2019-10-proteins-language.html 原文链接:https://www.nature.com/articles/s41592-019-0598-1                                  原文标题:Unified rational protein engineering with sequence-based deep representation learning
  • 《深度学习助力蛋白设计》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2020-04-08
    • 蛋白设计通常有两种方法:“定向进化”是指随机改变编码天然蛋白质的氨基酸构件的基因序列,筛选具有所需活性的变体;“合理设计”是根据蛋白质3D结构对其进行建模,以识别可能影响蛋白质功能的氨基酸。然而,定向进化只能触及庞大数量蛋白质序列中的一小部分,而合理设计则需要对蛋白质3D结构进行艰难的解析。 2019年10月21日Nature Methods报道,哈佛大学Wyss生物启发工程研究所和哈佛医学院的研究人员创建了第三种蛋白质设计方法,利用深度学习直接从氨基酸序列中预测蛋白质基本特征。研究结果显示,该方法准确地预测了天然和从头设计的蛋白质功能,将大量工作转移给计算机,与现有方法相比,可将成本降低两个数量级。 研究人员将这个神经网络方法命名为“统一表示”(unified representation,UniRep),在大约三周的时间内,研究者对UniRep进行了约2400万个蛋白质序列的训练,以关联蛋白质序列及其特性,包括蛋白质稳定性、二级结构以及蛋白质内部序列对周围溶剂的可及性等。结果UniRep准确地描述了来自不同的蛋白质家族的蛋白质的这些特征,包括那些已经被研究清晰解析的蛋白质,以及自然界中不存在的蛋白质。 该团队进一步将UniRep作为研究工具,以预测单个氨基酸取代如何影响蛋白质功能。该神经网络以多种生物学功能(包括酶催化、DNA结合、分子传感)可靠地预测了8种不同蛋白质中单个氨基酸突变的影响。此外,研究者使用绿色荧光蛋白作为模型,利用UniRep分析了该蛋白的64,800个变异体,每个变异体带有1~12个突变,结果UniRep准确地预测了突变的分布及其对蛋白质亮度的影响。 研究者表示,这种基于深度学习的蛋白质工程计算方法具有加速合成蛋白质设计的潜力,该方法可以针对任何所需应用量身定制蛋白质功能,可用于治疗、诊断、生物制造、生物催化及其他应用。