《首个多作物参考面板数据库发布》

  • 来源专题:转基因生物新品种培育
  • 编译者: 王晶静
  • 发布时间:2020-12-06
  • 11月2日,华中农业大学信息学院生物信息团队在《核酸研究》发表研究成果,通过收集包括水稻,玉米、小麦、油菜和棉花等12个重要农作物的遗传变异信息,构建了植物中首个多物种的高质量遗传参考变异库,为植物遗传育种研究提供了宝贵资源。

    基因型填充是根据参考面板(又译参考集)中的单体型和基因型对目标样本中缺失基因型的估计填充过程。基因型填充可以有效增加单核苷酸多态性(SNPs)的密度,因此被广泛用于相对便宜和低密度的SNP芯片的填充以进行大规模全基因组关联研究(GWAS)。然而,大多数植物缺乏高质量的参考面板,这极大地限制了基因型填充在植物中的应用。为了克服这一限制,研究者开发了植物遗传参考变异库——Plant-ImputeDB,数据库通过整合了包括水稻、玉米、小麦、油菜和棉花等12个重要农作物的遗传变异信息和全基因组重测序数据(包括34244个样本的约6990万个SNP的遗传变异信息),构建了植物中首个多物种参考面板的综合数据库。该数据库(链接为http://gong_lab.hzau.edu.cn/Plant_imputeDB/)提供在线的基因型填充,支持SNP和基因组block两种方式搜索、浏览并提供相应数据下载,同时接受不同类型的基因组变异数据的提交,提供对所有公开可用数据的免费和开放访问,以支持全球范围内的相关研究。该研究成果得到了中央高校基本科研业务费、国家重点研发计划、华中农业大学科技创新基金等项目的资助。原文链接请参见:https://doi.org/10.1093/nar/gkaa953

相关报告
  • 《研究发布大豆多维组学数据库SoyOmics》

    • 来源专题:生物育种
    • 编译者:姜丽华
    • 发布时间:2023-04-09
    •  大豆(Glycine max (L.) Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大豆遗传育种提供有力支持。   近日,中国科学院遗传与发育生物学研究所田志喜团队联合北京基因组研究所(国家生物信息中心)章张、宋述慧团队,开发了大豆多维组学深度整合数据库SoyOmics。相关研究成果以SoyOmics: A deeply integrated database on soybean multi-omics为题,发表在《分子植物》(Molecular Plant)上。   SoyOmics数据库全面整合分析了大豆相关的多维组学数据。数据库目前收录了27个大豆品系的从头组装基因组数据,并对相应基因组信息进行了全面的基因组注释。该数据库以高质量的ZH13作为参考基因组,对2898份材料的全基因组测序数据进行了全基因组序列变异检测,鉴定到约3800万条SNP/INDEL变异数据,同时为每个变异位点提供多层次注释信息。除序列变异外,数据库提供了来自大豆泛基因组分析的约55万条结构变异数据以及基于结构变异构建的图泛基因组。数据库收录了来自ZH13和Williams82两个基因组27个组织时期的表达数据以及其他26个品系9个组织时期的表达数据,并展示了不同品系间同源基因的差异表达。数据库针对115个表型多年多点测定的约2.7万条表型记录进行了本体注释和归类,并将表型数据与变异数据进行关联。除以上组学数据外,数据库同时提供了部分种质资源的甲基化测序数据以及Soy40K大豆芯片数据。该数据库从基因组、变异组、转录组、表型组等不同层面整合了大豆相关数据集,实现了不同层次组学数据的交互查询和联合比较分析。   为更好服务于用户,研究团队开发了多个实用的“一站式”分析模块,支撑实现GWAS分析、表达模式分析、单倍型分析、基因组坐标转换、图泛基因组可视化等。该数据库具备多维组学数据间的深度关联性、用户的高度可交互性及分析场景的高覆盖性,预期能为大豆遗传学及育种研究提供基础数据支撑和全新的观察视角。   研究工作得到中国科学院战略性先导科技专项、科技创新2030-重大项目、国家自然科学基金、国家重点研发计划、博士后创新人才计划等的支持。
  • 《昆明动物所等发布中国蛇类DNA条形码参考数据集》

    • 来源专题:生物育种
    • 编译者:姜丽华
    • 发布时间:2023-04-21
    • 两栖爬行动物总体形态较保守且存在趋同现象,给传统分类带来了困难,仅仅使用形态学的鉴定标准极大地影响了对其物种多样性的正确评估。DNA条形码技术由于采用数字化形式,使样本鉴定过程能够实现自动化和标准化,突破了对传统形态经验的过度依赖,不受生物体发育阶段的限制,可弥补传统形态学鉴定方法的不足。DNA条形码技术与传统形态学分类方法相结合不仅可以快速、准确的对物种进行鉴定和分类,还可能发现许多潜在的物种。   作为全球范围的两栖爬行动物DNA条形码“COLDCODE”计划发起团队之一,中国科学院昆明动物研究所张亚平团队和车静团队在前期的工作中已经解决了两栖爬行动物中COI引物扩增较为困难的瓶颈问题,为“COLDCODE”计划实施奠定了技术基础。   基于系统的野外考察和长期的积累,车静团队联合国内多家单位科研人员开展了广泛合作交流,结合NCBI已发表数据,首次系统性构建了中国蛇类DNA条形码参考数据集(COI),对中国蛇类多样性进行了评估。该研究涉及228个已知物种,占已描述物种的80.6%,覆盖了中国大部分区域。   研究表明:1.中国蛇类物种多样性被低估,保守估计中国蛇类存在至少36个未被描述的新种。这些未被描述的新种主要分布在游蛇科、水游蛇科和蝰科。除此之外,DNA条形码的结果还提示传统分类可能严重低估了中国蛇类的物种多样性。2.DNA条形码能够有效鉴定大部分的中国蛇类到物种水平,但是对于存在分类争议、不完全谱系分选、基因渐渗和复杂的物种形成及分化机制等类群,DNA条形码表现出较低的识别效率。3.部分物种DNA条形码数据分析呈现一定的谱系地理结构,如“海岛-大陆”分化模式(台湾海峡和琼州海峡的隔离作用)和中国“东-西”分化模式。   中国具有丰富的蛇类物种多样性,已知现存的蛇类有283种,隶属18科65属(截止2020年12月31日),占世界总蛇类种数的8%左右。近年来,中国蛇类物种数量仍然在不断增加。此外,近几十年来,由于对蛇类资源的过度开发利用,加之栖息地遭破坏、非法的收集和蛇类贸易等,中国蛇类面临严重威胁。根据IUCN的评估,其中有2种极危蛇种、4种濒危蛇种,18种易危和近危蛇种。同时,蛇类具有重要的应用价值,自古以来被人类所食用、药用以及作为化工原料,其中蛇毒是极为珍贵的药物原料,在医药领域中有很大利用价值。以上研究构建的DNA条形码参考数据集为中国蛇类研究、资源保护和监管提供了科学数据支撑。   以上研究成果发表于《分子生态资源》(Molecular Ecology Resources),车静、张亚平、宜宾学院教授郭鹏、安徽师范大学教授黄松为文章共同通讯作者。研究得到科技部重点研发项目、第二次青藏高原综合科学考察研究项目、中国科学院战略性先导科技专项、国家自然科学基金项目,以及中国西南野生生物种质资源库动物分库(国家重大科技基础设施专项)等相关项目的支持。