《首个全球人群基因组多样性和祖源信息数据库》

  • 来源专题:生物安全知识资源中心 | 领域情报网
  • 编译者: huangcui
  • 发布时间:2017-12-06
  • 11月3日,中国科学院上海生命科学研究院(人口健康领域)计算生物学研究所徐书华课题组的研究成果,以PGG.Population: a database for understanding genomic diversity and genetic ancestry of human populations为题,在线发表在《核酸研究》上。该研究分析了涵盖全球范围107个国家的356个人类族群的基因组多样性和祖源信息,并发布了开放获取的专门数据库——PGG.Population(群体基因组学·族群)。

    PGG.Population是迄今唯一在基因组水平专门解析人类族群遗传关系和祖源信息的公开数据库,也是目前收集族群数量最大的群体基因组数据库,为研究人员、临床医生及学生和公众理解不同人群的遗传背景提供查询和分析平台。

    人类族群多样性的形成是迁移、隔离、分化、再接触和交流的复杂演化过程。同时,长期对特定环境的适应或能影响特定的性状以及基因组局部区域的多样性变化。相对来讲,人群的基因组多样性在很大程度上决定了其表型多样性——这也是族群特异性的表型可以世代传承的原因。因此,要真正理解人类不同族群在肤色、体质以及疾病等性状上的差异,最终需要回到基因组、追溯人群的演化历程。

    众多大型国际计划(比如人类单倍体型图计划和千人基因组计划)以及我国此前完成的各类全基因组关联研究(GWAS)集中关注常见主体人群,而对各地少数族群(大多是土著人群)的研究较为缺乏。部分研究人员逐渐意识到,在一个人群研究中的困惑,往往在另一个人群的研究中找到答案,例如科研人员对比青藏高原人群的基因组,了解到为何平原人群无法像藏族人那样舒适地生活在高原上。专家认为,这就是多样性的魅力,也是进化留给我们的财富。

    PGG.Population正是在这样的大背景下建立起来。研究人员通过测序或收集众多人类群体基因组研究数据,对每个族群的基因组重新整合与分析(包括人群的地理语言归属等基本信息、Y染色体与线粒体谱系、群体间亲缘关系、群体遗传结构、遗传混合以及自然选择印记等),并建立数据库,以开放获取的方式向公众展示每个族群的基因组多样性与祖源信息。

    目前,该数据库包括7122个个体的基因组数据,覆盖107个国家的356个族群,每个族群都有自己的“故事”。该数据库以理解每个人群的基因组多样性与遗传背景为主,对其他研究领域也具有重要的学术意义和应用价值,人类群体基因组数据库建设任重道远。全世界有2000多个族群,而该数据库目前只包括世界族群的1/6。课题组正在收集或产生更多的来自不同族群基因组数据,以覆盖更多的族群,以期用于全面探索亚洲人群尤其是东亚、东南亚族群的演化历史和自然选择等遗传和演化问题。同时,数据库可供遗传学、语言学、体质人类学、医学等行业参考和使用,应用于生物医学等多个领域的研究。此外,科研人员希望公众通过访问和查询该数据库,对人类基因组多样性和人群祖源等方面的知识和信息有更广泛和深入的理解。

    研究工作得到了中国科学院战略性先导科技专项(B类)、国家自然科学基金委重大研究计划及国家相关人才计划、中国科学院青年促进会、上海市科委等的资助,并得到国家遗传与发育协同创新中心支持。

  • 原文来源:http://english.sibs.cas.cn/ns/es/201711/t20171117_186239.html
相关报告
  • 《我国构建全球首个作物根际"细菌+病毒"基因组数据库》

    • 来源专题:农业生物安全
    • 编译者:李周晶
    • 发布时间:2025-04-14
    • 中国科学院与北京大学的研究人员通过构建作物根际细菌基因组数据库(CRBC)和病毒基因组数据库(CRVC),显著扩展了对作物根际微生物多样性的理解,并揭示了新的微生物间互作模式。相关成果于2025年3月12日在线发表在《Cell》。 植物根际细菌的功能研究和群落分析已成为作物根际微生物群落研究的前沿领域,作物根际细菌和病毒基因组数据库的缺乏,严重限制了该领域的发展。研究人员通过将高通量细菌培养与宏基因组测序相结合,小组从小麦、水稻、玉米和紫花苜蓿的根部构建了全面的细菌和病毒基因组集合,构建了作物根际细菌基因组数据库(CRBC)和病毒基因组数据库(CRVC),显著扩展了公开可用的作物根际细菌基因组数量约3倍,鉴定的病毒在属水平上50%未被报道。CRBC涵盖了2318个物种,是公共数据库中作物根际细菌基因组物种数的2.8倍约3倍,并将公共可用的作物根际细菌系统发育多样性增加了290.6%。作物根系病毒基因组集合(CRVC)包含9,736个非冗余病毒基因组,并在作物根系微生物组中发现了1,572个先前未报道的属级聚类。基于以上数据,首次发现了植物根际细菌定植相关的保守遗传通路,并创新性地揭示了作物根际生态系统中未曾探索的细菌-病毒互作规律。CRBC和CRVC共同为研究微生物机制和应用提供了宝贵的资源,支持可持续农业发展。
  • 《中国农科院:全球首个作物黄萎病菌资源和基因组数据库上线》

    • 来源专题:转基因生物新品种培育
    • 编译者:王晶静
    • 发布时间:2020-11-26
    • 澎湃新闻记者从中国农业科学院获悉,近日,中国农科院植物保护研究所作物黄萎病研究团队与美国加州大学戴维斯分校联合牵头的“全球黄萎病菌基因组研究”计划取得重要进展,搭建了国际上第一个作物黄萎病菌资源和基因组数据库(Verticilli-Omics)并正式上线(https://db.cngb.org/Verticilli-Omics )。 用户可在该网站查阅收录的菌种资源信息、测序基因组可视化展示、数据挖掘和分析等工作。 大丽轮枝菌是一种毁灭性的土传维管束病原真菌,曾与马铃薯晚疫病病原并列为世界头号检疫对象,寄主广泛,年均损失近百亿美元。而该病原难以防控的重要原因是种群结构复杂,农业生产实践中缺少分子流行检测技术。 针对这一难题,中国农科院作物黄萎病研究团队联合国内外16家单位开展协同攻关,构建了迄今为止来源国家和寄主最为系统、基因型最为全面的菌种资源库,发起了“全球黄萎病菌基因组研究”计划。据介绍,目前已完成了159株大丽轮枝菌全基因组及3624株基因组重测序工作,搭建了Verticilli-Omics数据库1.0版本并开始线上运行。 Verticilli-Omics数据库1.0版本优先释放了菌种资源和全基因组数据。菌种资源数据库收录了来源10个国家26个寄主共8102份黄萎病菌菌种资源,为迄今为止遗传多样性最丰富的菌种资源数据库;全基因组数据库释放了159个大丽轮枝菌全基因组数据,占目前已释放大丽轮枝菌基因组总数的85%;搭建了基因组可视化、基因组注释信息、基因功能检索、基因组家族聚类、基因比对、基因多样性鉴定、致病相关基因富集等检索和分析通道。 研究团队目前还在搭建Verticilli-Omics数据库2.0版本,主要展示全球大丽轮枝菌遗传变异组数据。 研究团队认为,Verticilli-Omics数据库在线将为作物黄萎病研究领域提供重要的数据资源和共享服务,同时也为合作团队后续构建全球大丽轮枝菌种群结构参考“基线”并阐明其演化机制、建立完善的种群分子流行监测技术体系提供重要支撑。