《Nature | 通过全球宏基因组揭示功能性暗物质》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2023-10-14
  • 2023年10月11日,美国能源部联合基因组研究所的Georgios A. Pavlopoulos在Nature上发表题为Unraveling the functional dark matter through global metagenomics的文章。该研究开发了一种计算方法,从宏基因组的序列空间中生成无参考的蛋白质家族,以研究目前通过参考基因组所能实现的功能多样性之外尚未开发的功能多样性的规模。

    该研究从IMG/M的26,931个宏基因组数据集中识别了新蛋白空间,去除了与IMG数据库中超过100,000个参考基因组或Pfam的所有基因匹配的基因,识别出 11.7 亿个长度超过 35 个氨基酸的蛋白质序列,这些序列与 102,491 个参考基因组或 Pfam 数据库中的任何序列都不相似。利用基于大规模并行图的聚类方法,该研究将这些蛋白质归入了 106,198 个成员超过 100 个的新序列群,这比利用相同方法从参考基因组聚类得到的蛋白质家族数量翻了一番。

    该研究揭示了一个极其多样化的功能空间,突出了进一步探索微生物功能暗物质的重要性。

    本文内容转载自“环境科研人”微信公众号。

    原文链接: https://mp.weixin.qq.com/s/sc3As2BMfLHYi6blErBL7A



相关报告
  • 《Nature | 古代基因组揭示了奇琴伊察的仪式生活》

    • 编译者:李康音
    • 发布时间:2024-06-15
    • 2024年6月12日,马克斯-普朗克进化人类学研究所等机构的研究人员在 Nature 期刊发表了题为Ancient genomes reveal insights into ritual life at Chichén Itzá的文章。 位于墨西哥尤卡坦半岛的奇琴伊察古城是古典晚期和古典末期(公元600-1000年)最大和最有影响力的玛雅人定居点之一,它仍然是中美洲研究最深入的考古遗址之一。然而,关于其仪式空间的社会和文化用途,以及其人口与其他中美洲群体的遗传联系,许多问题仍未得到解答。 该研究展示了从64个亚成年个体中获得的全基因组数据,这些个体可追溯到公元500-900年左右,这些个体是在奇琴伊察仪式中心的神圣天然井(天坑)附近的一个地下集体埋葬中发现的。遗传分析表明,所分析的个体均为雄性,有几个个体亲缘关系密切,包括两对同卵双胞胎。双胞胎在玛雅和更广泛的中美洲神话中占有重要地位,他们体现了神和英雄之间的二元性(5),但直到现在,他们还没有在古玛雅的殡葬背景中被确认。与该地区现代人的遗传比较表明,除了与人类免疫有关的某些遗传位点,包括人类白细胞抗原复合物,与奇琴伊察古代居民的遗传具有连续性外,这表明由于殖民时期传入该地区的传染病而产生的适应信号。
  • 《Nature | 合成逆转序列揭示基因组的默认状态》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-03-13
    • 2024年3月6日,纽约大学的研究人员在Nature发表题为Synthetic reversed sequences reveal default genomic states的文章。 这篇论文研究了在不同物种中广泛存在的转录活动,以及这些基因组活动是选择效应还是“噪音”的结果。为了理解广泛的转录活动是否具有生物学意义,研究人员在酿酒酵母和小鼠的基因组中引入了一个合成的101 kb基因座,并对基因组活动进行了表征。该基因座是通过将人类HPRT1序列反向插入,包括其侧翼区域,从而保留了自然序列的基本特征,但消除了进化过程中形成的编码或调控信息。 研究人员观察到在酵母中,反向插入和原始HPRT1基因座都表现出广泛的活性,尽管缺乏进化形成的酵母启动子。相比之下,在小鼠胚胎干细胞中,反向插入基因座完全没有活性,而且显示出抑制性染色质标记。去除CpG二核苷酸的变异型基因座缓解了抑制性标记,然而,这种变异型基因座也是转录不活跃的。这些结果显示,缺乏编码信息的合成基因组序列在酵母中是活跃的,但在小鼠胚胎干细胞中是不活跃的。这与这两种不同的真核细胞类型之间的“默认基因组状态”存在重大差异,对于理解广泛的转录、基因信息的水平传递以及新基因的诞生具有重要意义。