人类微生物组计划(Human Microbiome Project,HMP)项目创建的综合基因目录(Integrated Gene Catalog,IGC)已成功应用于不同临床背景下的微生物组关联研究,高通量测序和新宏基因组学分析方法的出现促成元基因组组装的基因组(MAGs)使人们对人类和其他环境中微生物组组成的理解进一步加深。但由于IGC与MAG存在一些固有缺陷(如IGC包含与其起源基因组没有直接关联的基因)等问题,欧洲生物信息学研究所(European Bioinformatics Institute,EMBL-EBI)研究人员提出了统一的人类胃肠道基因组(Unified Human Gastrointestinal Genome,UHGG)合集,其包括来自4644个肠道原核生物的204938个非冗余基因组,这些基因组编码了超过1.7亿个蛋白序列,研究者将这些蛋白序列收集到统一人类胃肠道基因组目录(Unified Human Gastrointestinal Protein,UHGP)中。与IGC中的蛋白质相比,UHGP的肠道蛋白质数量增加了一倍以上。超过70%的UHGG物种缺乏可培养的代表,而40%的UHGP缺乏功能性注释。种内基因组变异分析显示大量辅助基因和单核苷酸变异,其中许多具有个体特异性。UHGG和UHGP合集将使研究能够将人类肠道微生物组中的基因型与表型联系起来。全面、高质量的参考基因组对于人类肠道微生物群的功能表征和分类学是必须的,该研究为微生物研究者提供全面资源,超过20万的肠道原核生物的参考基因组及其编码的蛋白质都被收录整理。相关研究成果于2020年7月20日发表在Nature Biotechnology上。
宋琪 编译自https://www.nature.com/articles/s41587-020-0603-3
原文标题:A unified catalog of 204,938 reference genomes from the human gut microbiome