《Nature | 通过全球宏基因组揭示功能性暗物质》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2023-10-14
  • 2023年10月11日,美国能源部联合基因组研究所的Georgios A. Pavlopoulos在Nature上发表题为Unraveling the functional dark matter through global metagenomics的文章。该研究开发了一种计算方法,从宏基因组的序列空间中生成无参考的蛋白质家族,以研究目前通过参考基因组所能实现的功能多样性之外尚未开发的功能多样性的规模。

    该研究从IMG/M的26,931个宏基因组数据集中识别了新蛋白空间,去除了与IMG数据库中超过100,000个参考基因组或Pfam的所有基因匹配的基因,识别出 11.7 亿个长度超过 35 个氨基酸的蛋白质序列,这些序列与 102,491 个参考基因组或 Pfam 数据库中的任何序列都不相似。利用基于大规模并行图的聚类方法,该研究将这些蛋白质归入了 106,198 个成员超过 100 个的新序列群,这比利用相同方法从参考基因组聚类得到的蛋白质家族数量翻了一番。

    该研究揭示了一个极其多样化的功能空间,突出了进一步探索微生物功能暗物质的重要性。

    本文内容转载自“环境科研人”微信公众号。

    原文链接: https://mp.weixin.qq.com/s/sc3As2BMfLHYi6blErBL7A



相关报告
  • 《Nature | 家族水平基因组揭示了鸟类演化的复杂性》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-04-10
    • 2024年4月2日,浙江大学生命演化研究中心张国捷教授组织的国际万种鸟类基因组研究计划在在Nature 在线发表题为Complexity of avian evolution revealed by family-level genomes的研究论文。 该研究覆盖了92%的现生鸟科代表物种,利用全基因组数据重新构建了现生鸟类系统发育树,建立了一套新的鸟类分类划分方案,改变了过去对鸟类演化历史的认识。 该研究利用基因间区数据集重构鸟类系统发育关系,将包含了约95%现生鸟类物种的新鸟类被重新梳理为四个主要的演化分支,分别是奇迹鸟类(火烈鸟总目)、鸽鸨类、陆鸟类和元素鸟类。其中 “元素鸟类”是本研究中新确定的类群,包含了麝雉目、夜鹰目、鹤形目等类群。新的鸟类生命之树解决了主要代表鸟类类群一直悬而未决的演化地位问题。研究对鸟类系统发育树进行了更精准的推断,也为新鸟类在白垩纪末大灭绝事件之后发生物种大爆发的假说提供证据支持。
  • 《Nature | 转录-复制相互作用揭示了细菌基因组调控》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-01-29
    • 2024年1月24日,纽约大学格罗斯曼医学院等机构的研究人员在杂志Nature上发表了题为Transcription–replication interactions reveal bacterial genome regulation的文章。 生物体通过几种在整个基因组中重复出现的调控模式来确定数千个基因的转录率。在细菌中,基因的调控结构与其表达之间的关系对于单个模型基因回路是很清楚的。然而,在基因组尺度上缺乏对这些动态的更广泛视角,部分原因是细菌转录组学迄今为止只捕获了数百万个细胞平均表达的静态快照。因此,基因表达动力学的全部多样性及其与调控结构的关系仍然未知。 该研究提出了一种新的全基因组调节模式分类,该分类基于每个基因对其自身复制的转录反应,研究人员称之为转录-复制相互作用谱(TRIP)。通过分析单细菌RNA测序数据,研究人员发现对染色体复制普遍扰动的反应将生物调控因子与染色体上的生物物理分子事件相结合,揭示了基因的局部调控背景。虽然许多基因的 TRIP 符合基因剂量依赖性模式,但其他基因以不同的方式分化,这是由操纵子内位置和抑制状态等因素决定的。通过揭示基因表达异质性的潜在机制驱动因素,这项工作为模拟复制依赖性表达动力学提供了一个定量的生物物理框架。