《利用宏基因组序列测定蛋白质结构》

  • 来源专题:转基因生物新品种培育
  • 编译者: Zhao
  • 发布时间:2017-02-21
  • 尽管结构生物学家们努力了几十年,仍然有约5200个蛋白质家族的结构还处于未知状态。该文献揭示了由进化信息推断的残基接触指导下的Rosetta结构预测可以准确地模拟出蛋白质所属家族,并发现为准确建模宏基因组序列数据将三倍于蛋白质家族数量充足的基因序列数据。我们整合了宏基因数据、基于接触的结构匹配和Rosetta结构计算来为614个目前结构未知的蛋白质家族建模,其中206个膜蛋白,137个未展示的蛋白在蛋白数据库中没有体现。这种方法为最初设想为蛋白结构计划目标的一小部分的蛋白质大家族提供了代表性的模型。

相关报告
  • 《大数据方法预测蛋白质结构》

    • 来源专题:转基因生物新品种培育专项服务
    • 编译者:Zhao
    • 发布时间:2017-02-16
    • 蛋白质的结构决定其功能。 实验蛋白结构测定是繁琐和昂贵的,这已经驱动了从序列信息预测蛋白质结构的方法的探索。(1) 约一半的已知蛋白质适于比较模拟; 也就是说,已知结构的正在演化中的相关蛋白可以用作模拟未知结构的样本。 对于剩余的蛋白质,没有发现令人满意的解决方案。(2)最近开发的方法用于预测蛋白质氨基酸接触与微生物DNA的宏基因组学的蛋白质序列组合以计算622个蛋白质家族的可靠模型,并且发现了100多个新的折叠。 宏基因组学数据的快速增长能够使更多的蛋白家族的结构预测变得更可靠。
  • 《Nature | 239灵长类动物基因组中受限序列元件的鉴定》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2023-12-04
    • 2023年11月29日,美国 Illumina公司等机构在Nature上发表了题为Identification of constrained sequence elements across 239 primate genomes的文章。 非编码DNA对于我们理解人类基因调控和复杂疾病至关重要,测量进化序列约束可以确定人类基因组中推定的调控元件的功能相关性。与蛋白质编码DNA相比,非编码DNA的进化更快,分离灵长类动物物种的时间相对较短,以及以前全基因组测序的可用性有限,阻碍了鉴定在灵长类动物中特异性受到限制的基因组元件。 该研究构建了239个物种的全基因组比对,代表了灵长类动物中所有现存物种的近一半。使用该资源,研究人员以5% 的错误发现率鉴定了在灵长类动物和其他哺乳动物中处于选择性约束下的人类调控元件。研究人员检测到111318个DNase I超敏性位点和267410个转录因子结合位点,这些位点在灵长类动物中特异性受到限制,但在其他胎盘哺乳动物中不受限制,并验证了它们对基因表达的顺式调控作用。这些调控元件富含影响基因表达和复杂性状和疾病的人类遗传变体。该研究结果强调了近期进化在将包括人类在内的灵长类动物与其他胎盘哺乳动物区分开来的调控序列元件中的重要作用。