《全球首个能公开访问的基因组变体与疾病关联的数据库发布》

  • 来源专题:中国科学院文献情报生命健康领域集成服务门户
  • 编译者: 陈大明
  • 发布时间:2019-11-25
  • 11月5日消息,全球首个能公开访问的基因组变体与疾病相关数据的数据库MaveDB发布。MaveDB由澳大利亚沃尔特和伊丽莎·霍尔医学研究所、美国华盛顿大学和加拿大多伦多大学的科学家合作开发,存储了变异性的多重测定(MAVEs)实验所得数据。MAVEs实验系统地测量了数千个单个序列变体对基因功能的影响,并提供了关于基因如何产生蛋白质、基因变体与疾病之间的联系以及如何设计更有效的天然蛋白质等信息。该数据库将增强科学家访问和解释复杂功能基因组数据的能力,促进科学家之间的合作研究。相关研究成果发表于《基因组生物学》期刊。

  • 原文来源:;https://researchbuzz.me/2019/11/05/genomics-research-architecture-pedagogy-spoken-yucatec-maya-more-tuesday-researchbuzz-november-5-2019
相关报告
  • 《首个全球人群基因组多样性和祖源信息数据库》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:huangcui
    • 发布时间:2017-12-06
    • 11月3日,中国科学院上海生命科学研究院(人口健康领域)计算生物学研究所徐书华课题组的研究成果,以PGG.Population: a database for understanding genomic diversity and genetic ancestry of human populations为题,在线发表在《核酸研究》上。该研究分析了涵盖全球范围107个国家的356个人类族群的基因组多样性和祖源信息,并发布了开放获取的专门数据库——PGG.Population(群体基因组学·族群)。 PGG.Population是迄今唯一在基因组水平专门解析人类族群遗传关系和祖源信息的公开数据库,也是目前收集族群数量最大的群体基因组数据库,为研究人员、临床医生及学生和公众理解不同人群的遗传背景提供查询和分析平台。 人类族群多样性的形成是迁移、隔离、分化、再接触和交流的复杂演化过程。同时,长期对特定环境的适应或能影响特定的性状以及基因组局部区域的多样性变化。相对来讲,人群的基因组多样性在很大程度上决定了其表型多样性——这也是族群特异性的表型可以世代传承的原因。因此,要真正理解人类不同族群在肤色、体质以及疾病等性状上的差异,最终需要回到基因组、追溯人群的演化历程。 众多大型国际计划(比如人类单倍体型图计划和千人基因组计划)以及我国此前完成的各类全基因组关联研究(GWAS)集中关注常见主体人群,而对各地少数族群(大多是土著人群)的研究较为缺乏。部分研究人员逐渐意识到,在一个人群研究中的困惑,往往在另一个人群的研究中找到答案,例如科研人员对比青藏高原人群的基因组,了解到为何平原人群无法像藏族人那样舒适地生活在高原上。专家认为,这就是多样性的魅力,也是进化留给我们的财富。 PGG.Population正是在这样的大背景下建立起来。研究人员通过测序或收集众多人类群体基因组研究数据,对每个族群的基因组重新整合与分析(包括人群的地理语言归属等基本信息、Y染色体与线粒体谱系、群体间亲缘关系、群体遗传结构、遗传混合以及自然选择印记等),并建立数据库,以开放获取的方式向公众展示每个族群的基因组多样性与祖源信息。 目前,该数据库包括7122个个体的基因组数据,覆盖107个国家的356个族群,每个族群都有自己的“故事”。该数据库以理解每个人群的基因组多样性与遗传背景为主,对其他研究领域也具有重要的学术意义和应用价值,人类群体基因组数据库建设任重道远。全世界有2000多个族群,而该数据库目前只包括世界族群的1/6。课题组正在收集或产生更多的来自不同族群基因组数据,以覆盖更多的族群,以期用于全面探索亚洲人群尤其是东亚、东南亚族群的演化历史和自然选择等遗传和演化问题。同时,数据库可供遗传学、语言学、体质人类学、医学等行业参考和使用,应用于生物医学等多个领域的研究。此外,科研人员希望公众通过访问和查询该数据库,对人类基因组多样性和人群祖源等方面的知识和信息有更广泛和深入的理解。 研究工作得到了中国科学院战略性先导科技专项(B类)、国家自然科学基金委重大研究计划及国家相关人才计划、中国科学院青年促进会、上海市科委等的资助,并得到国家遗传与发育协同创新中心支持。
  • 《首个多作物参考面板数据库发布》

    • 来源专题:转基因生物新品种培育
    • 编译者:王晶静
    • 发布时间:2020-12-06
    • 11月2日,华中农业大学信息学院生物信息团队在《核酸研究》发表研究成果,通过收集包括水稻,玉米、小麦、油菜和棉花等12个重要农作物的遗传变异信息,构建了植物中首个多物种的高质量遗传参考变异库,为植物遗传育种研究提供了宝贵资源。 基因型填充是根据参考面板(又译参考集)中的单体型和基因型对目标样本中缺失基因型的估计填充过程。基因型填充可以有效增加单核苷酸多态性(SNPs)的密度,因此被广泛用于相对便宜和低密度的SNP芯片的填充以进行大规模全基因组关联研究(GWAS)。然而,大多数植物缺乏高质量的参考面板,这极大地限制了基因型填充在植物中的应用。为了克服这一限制,研究者开发了植物遗传参考变异库——Plant-ImputeDB,数据库通过整合了包括水稻、玉米、小麦、油菜和棉花等12个重要农作物的遗传变异信息和全基因组重测序数据(包括34244个样本的约6990万个SNP的遗传变异信息),构建了植物中首个多物种参考面板的综合数据库。该数据库(链接为http://gong_lab.hzau.edu.cn/Plant_imputeDB/)提供在线的基因型填充,支持SNP和基因组block两种方式搜索、浏览并提供相应数据下载,同时接受不同类型的基因组变异数据的提交,提供对所有公开可用数据的免费和开放访问,以支持全球范围内的相关研究。该研究成果得到了中央高校基本科研业务费、国家重点研发计划、华中农业大学科技创新基金等项目的资助。原文链接请参见:https://doi.org/10.1093/nar/gkaa953