《Nature | 通过全球宏基因组揭示功能性暗物质》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2023-10-13
  • 2023年10月11日,美国能源部联合基因组研究所的Georgios A. Pavlopoulos在Nature上发表题为Unraveling the functional dark matter through global metagenomics的文章。该研究开发了一种计算方法,从宏基因组的序列空间中生成无参考的蛋白质家族,以研究目前通过参考基因组所能实现的功能多样性之外尚未开发的功能多样性的规模。

    该研究从IMG/M的26,931个宏基因组数据集中识别了新蛋白空间,去除了与IMG数据库中超过100,000个参考基因组或Pfam的所有基因匹配的基因,识别出 11.7 亿个长度超过 35 个氨基酸的蛋白质序列,这些序列与 102,491 个参考基因组或 Pfam 数据库中的任何序列都不相似。利用基于大规模并行图的聚类方法,该研究将这些蛋白质归入了 106,198 个成员超过 100 个的新序列群,这比利用相同方法从参考基因组聚类得到的蛋白质家族数量翻了一番。

    该研究揭示了一个极其多样化的功能空间,突出了进一步探索微生物功能暗物质的重要性。

    本文内容转载自“环境科研人”微信公众号。

    原文链接: https://mp.weixin.qq.com/s/sc3As2BMfLHYi6blErBL7A



  • 原文来源:https://www.nature.com/articles/s41586-023-06583-7
相关报告
  • 《Nature子刊:深度挖掘人类肠道宏基因组的古菌病毒》

    • 来源专题:生物安全知识资源中心—领域情报网
    • 编译者:hujm
    • 发布时间:2023-01-03
    • 人类微生物组的组成和功能与宿主的健康密切相关。除了细菌外,肠道微生物群中的非细菌成员(古菌、真菌和病毒)也在微生物群落的动态演替以及人类的生理、免疫、疾病等方面发挥着重要作用。   古菌是人体的共生微生物之一,它们曾在肠道,口腔和皮肤等部位被检测到,与人类疾病密切相关。与细菌相比,古菌在人体内的丰度相对较低,而且大多不可培养,因此与人类相关的古菌经常被忽视。病毒控制着微生物群落的组成和代谢,侵染古菌的病毒在基因组序列和病毒粒子结构方面具有很高的多样性。迄今为止,只有少数研究报道人类肠道内存在古菌病毒,因此,与人类相关的古菌病毒仍然神秘。随着下一代测序技术的发展以及海量数据的产生,基于宏基因组学的方法有助于我们对人类的古菌组和古菌病毒组进行广泛的研究。   2022年12月29日,中国科学院深圳先进技术研究院合成生物学研究所马迎飞团队在Nature Communications 期刊发表了题为:Metagenomic analysis reveals unexplored diversity of archaeal virome in the human gut 的研究论文。   该研究首次对来自人类肠道宏基因组的古菌病毒进行了深入挖掘及全面分析,揭示了人类肠道中古菌病毒组的多样性,为人类肠道古菌病毒组的研究提供了前所未有的一瞥。 人类肠道古菌病毒组的多样性   研究表明约有90%古菌基因组包含CRISPR结构, 因此CRISPR spacer-protospacer的匹配分析适用于古菌病毒序列的识别。为了对人类肠道中的古菌病毒进行全面搜索,团队首先构建了人类肠道相关古菌spacer序列数据库(HGASDB, Human Gut Associated Archaeal Spacer Database),并基于HGASDB和古菌病毒的特征基因构建了一套肠道古菌病毒的鉴定方法,从收集的2271个肠道宏基因组样品中及6个公开的病毒数据库中共鉴定出了1279种古菌病毒,构成人类肠道古菌病毒组数据库(HGAVD)(图1a)。随后,团队对鉴定出的病毒代表序列进行质量评估,大多数 (67%)病毒contigs的质量无法得到评估。与此同时,团队基于对病毒序列的网络分析以及病毒蛋白序列的注释信息,对HGAVD中的病毒序列进行了分类学的分析,其中大部分序列(68.4%)无法被分类到任何已知的病毒类别,这些分析表明人类肠道中依然存在大量未知的古菌病毒。此外,团队还将HGAVD中的病毒与公共的肠道病毒数据库进行了比较(图1d),发现来自HGAVD的大多数病毒(n=1097;86%)均无法与公共数据库中的病毒聚类到一起,这表明HGAVD对肠道古菌病毒组具有良好的代表作用。综上所述,HGAVD极大地扩展了人类肠道中古菌病毒多样性。 古菌病毒广泛分布于人类肠道中 为了了解肠道古菌病毒在全球人群中的分布情况,团队对1279条古菌病毒contigs在人类肠道样品中的丰度情况进行了估计,主坐标分析(PCoA)和Anosim分析的结果显示:肠道古菌病毒群落的组成在不同性别(ANOSIM,r=0.004,p=0.306)和不同BMI指数(ANOSIM,r=0.006,p=0.201)的人群中并无显著性差异。然而,当以国家作为界限分析时,我们观察到这些古菌病毒在各地表现出不同的多样性(图2a)。 团队进一步调查了这些古菌病毒在所有肠道样品中的检出率,共有7种古菌病毒在人群中的检出率10%,虽然这些病毒被归类到了7个不同的病毒簇(VCs)中,但它们的宿主均为Methanobrevibacter_A smithii(M. smithii)。就地理分布而言,这些古菌病毒在非洲人群中的检出率较低,但在亚洲、欧洲和美洲人群中则具有相对较高检出率 (图2b)。在人类肠道中检出率高于1%的古菌病毒共有712种,病毒序列IMG丨UGV-GENOME-0271153在人群中具有最高检出率(72.2%),该序列长度为40.51kb,被评估为中等质量的基因组,侵染M. smithii古菌。该病毒基因组编码46个基因,其中8个基因被预测为有尾病毒的功能基因(图2c)。此外,团队从人类肠道样品中共鉴定出13种smacoviruses,它们的长度分布在2.0-2.5kbp之间。这些病毒与古菌基因组上7个不同spacer序列相匹配,其宿主为Methanomassiliicoccus intestinalis或Methanomassiliicoccus_A intestinalis古菌。与亚洲和美洲人群相比,smacovirus在非洲和欧洲人群中具有更高检出率(图2d)。 M. smithii古菌的病毒在人类肠道古菌组中占主导地位 病毒能够以多种方式影响生态系统及微生物进化,例如部分噬菌体能够通过裂解宿主细胞改变微生物的群落结构和生态功能;一些噬菌体能够劫持其宿主的代谢机制,改变宿主细胞代谢产物浓度;噬菌体也可以作为宿主之间水平基因转移的载体,因此,对于病毒宿主的预测以及病毒与宿主相互作用的研究也是理解病毒的关键步骤。为此,我们通过CRISPR spacer序列建立古菌与其病毒序列间的匹配关系,推断出每种古菌病毒的可能宿主。不出所料,大多数(n=1217,95.2%)古菌病毒的宿主都是甲烷短杆菌(Methanobrevibacteria_A),它也是古菌中的优势属(图3a)。然后,我们通过统计每个古菌属对应的VC数量来衡量病毒的多样性,其中,47个VCs只侵染M. smithii古菌,17个VCs只侵染M. smithii_A古菌,但有13个VCs与这两种古菌均有关联,反映了古菌病毒能够跨种侵染宿主的特性。为了对古菌的跨宿主侵染情况进行更加详细的研究,团队构建了宿主与病毒关系网络(图3c),发现大约三分之一的肠道古菌病毒都具有广泛的宿主范围,并不局限于单一物种,这些分析为人类肠道微生物群中古菌病毒介导的基因流动网络提供了全面参考。 此外,侵染M. smithii的病毒是人类肠道古菌病毒的一个主要分支,为了进一步探索有尾古菌病毒的多样性,团队以末端酶大亚基(Terl,Large Subunit Terminase)作为标记构建M. smithii古菌病毒的系统发育树,以此来估计这些病毒的多样性(图3d)。以上基于Terl蛋白的系统发育分析扩展了M. smithii古菌病毒的多样性,并定义了新的谱系。 古菌病毒基因组编码广泛的蛋白功能 虽然人类肠道中古菌的功能蛋白已被广泛研究,但是对于肠道内古菌病毒蛋白的理解却十分有限。为此,团队从1279条古菌病毒代表序列上共预测出了97208个编码蛋白的基因,分别仅有 10.8%和 17.4% 的基因能够与pVOG数据库及PHROG数据库中的基因相匹配,表明人们目前对人类肠道古菌病毒的潜在功能知之甚少(图4a)。 在所有鉴定出的肠道古菌病毒中,M. smithii古菌病毒的蛋白功能最为多样,共包含了1034种不同功能的蛋白(只考虑了被指定生物功能的蛋白),其中包括一些病毒特有的功能蛋白,例如与结构、包装、裂解、DNA结合/调控和复制相关的蛋白,但其他一些古菌病毒则缺乏这些病毒特有的功能蛋白(图4b)。此外,团队还对36条完整古菌病毒代表序列的基因组进行了研究(图4c),其中23条序列携带PeiW(pseudomurein endoisopeptidase)基因,揭示了该基因对于病毒侵染产甲烷古菌的重要性。此外对33种有尾病毒基因组的分析结果表明,与人类肠道中的细菌病毒类似,温和古菌病毒在人类肠道古菌病毒中占据主体地位。 在这项研究中,研究团队对人类肠道中的古菌病毒进行了全面的宏基因组数据挖掘,本研究结果将为深入了解人体肠道内古菌病毒的多样性和蛋白功能提供前所未有的见解,以供人们更好地了解人类肠道生态系统。
  • 《万米深渊钩虾基因组揭示其环境适应性和种群历史》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:熊萍
    • 发布时间:2025-03-14
    • 近日,中国科学院深海科学与工程研究所张海滨研究员团队联合华大生命科学研究院等单位,在深渊钩虾环境适应与种群遗传方面取得新进展,研究成果以 “The amphipod genome reveals population dynamics and adaptations to hadal environment” 为题发表于国际学术期刊《Cell》。该研究经过近十年的努力,在中国科学院部署实施的“全球深渊深潜探索计划(Global TREnD)”支持下,使用“探索一号”科考船,以及我国自主研制的全海深载人潜水器“奋斗者”号和全海深着陆器“原位实验”号、“天涯”号等装备,对马里亚纳海沟、雅浦海沟、菲律宾海盆等科考航次获得的深渊钩虾(Hirondellea gigas)样本进行研究,通过染色体水平基因组和群体遗传学分析,并综合转录组、宏基因组、代谢组等多组学数据,揭示了这种分布水深超过万米的端足类适应深渊环境的分子机制,及其群体分化与种群动态历史。 染色体水平超大基因组 研究团队利用PacBio HiFi长读长测序和Hi-C三维基因组技术,成功组装了H. gigas的染色体水平的高质量基因组(大小13.92 Gb)。基因组分析揭示了其两大主要特征:内含子延长和重复序列扩张。与近缘物种相比,H. gigas的内含子长度显著增加,主要是由于重复序列的插入,尤其是串联重复和长散在重复序列(LINEs)转座子。H. gigas基因组中71.98%为重复序列,主要为串联重复,占到基因组的46.03%,显著高于其他无脊椎动物。特别是,与其他无脊椎动物基因组相比,H. gigas基因组中长单元串联重复序列(小卫星,10-100 bp)的比例更高,其比例与无脊椎动物基因组大小正相关。这些重复的产生可能与深渊极端环境的适应有关。 地理隔离塑造了不同钩虾群体的遗传分化 研究团队对马里亚纳海沟的510只(11个群体)、雅浦海沟94只(1个群体)及西菲律宾海盆深渊区的18只(1个群体)H. gigas个体进行了高覆盖的全基因组重测序和群体遗传学分析。结果显示来自马里亚纳海沟11个不同深度(~7000-11000米)群体不存在遗传分化,表明生活在马里亚纳海沟内的钩虾是一个完全混合的群体,高静水压不会限制其在海沟内的垂直迁移。而西菲律宾海盆的钩虾群体与马里亚纳海沟的群体则表现出明显的遗传分化。这两个海沟间相隔~1500公里,表明地理隔离阻碍了群体间的基因交流。 冰期-间冰期气候变化可能影响深渊种群动态历史 研究结果显示H. gigas的有效种群在约100万年前经历了一次急剧下降,这与更新世深海温度的大幅波动高度吻合。经过遗传瓶颈后,钩虾群体又经历了种群扩张。这一结果说明,更新世时期大的冰期-间冰期气候变化可能不仅造成了陆地动物的大规模灭绝,而且也深刻影响了深海甚至深渊动物。 宿主-微生物协同合作适应深渊极端环境 研究团队通过宏基因组和代谢组学整合分析揭示了H.gigas与共生菌的协同合作可能是钩虾适应深渊极高静水压和食物匮乏环境的关键。 氧化三甲胺(TMAO)是一种渗透调节物质,在渗透压调节以及在高静水压条件下维持细胞完整性方面发挥着重要作用。检测发现,随着深度增加,钩虾肠道内容物中TMAO浓度显著升高,体组织中也呈现类似趋势。钩虾自身编码fmo3基因,可将三甲胺(TMA)转化为TMAO。而其优势共生菌Psychomonas的基因组中携带cutC和cutD基因簇,可将胆碱分解为TMA;同时拥有torYZ操纵子,可以将TMAO还原为TMA,从而调控宿主体内的TMAO浓度,形成动态平衡。 极低的生产力和有限的食物被认为是制约深海生物代谢的关键因素之一。有研究推测H. gigas可能具备消化木质碎屑的能力。本研究在H.gigas基因组中发现了4种内切葡聚糖酶基因,可以将纤维素初步分解为纤维二糖;在共生菌Psychomonas中发现了纤维二糖酶、celB基因和磷酸纤维二糖酶,负责将纤维二糖进一步转化为D-葡萄糖,从而形成完整的纤维素代谢通路。这一机制可能最终促使H.gigas能够高效利用深渊食物资源,从而使其在食物匮乏的深渊海沟中成为一大优势类群。 目前,理解动物如何适应深渊仍然是一个科学难题。本研究中获得的H. gigas的基因组是全球已发表的“最深”的动物基因组,基于群体研究产出的数据量是迄今为止全球最大规模的针对单一海洋物种的重测序,为研究深渊生态系统提供了宝贵的数据资源。本研究结果为深入理解生命如何适应深渊环境提供了新的见解。 该研究得到了中国科学院战略性先导科技专项(B类)、中国科学院国际伙伴计划、国家重点研发计划、海南省重大科技计划以及“全球深渊深潜探索计划(Global TREnD)”支持。 中国科学院深海科学与工程研究所张海滨为文章第一作者/共同通讯作者,刘君、周洋以及华大生命科学研究院孙帅、郭群飞、孟亮、陈建威、向薛雁为共同第一作者,华大生命科学研究院范广益、刘姗姗、徐讯为共同通讯作者。 论文链接:https://doi.org/ 10.1016/j.cell.2025.01.030