《北京基因组所等开发出叶绿体基因组综合数据库》

  • 来源专题:转基因生物新品种培育
  • 编译者: 姜丽华
  • 发布时间:2022-10-31
  •       叶绿体是植物将光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,被广泛应用于植物系统进化关系研究、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,但如何整合应用这些数据目前仍面临数据命名标准不统一、数据信息不全以及较高经济价值的物种尚未进行测序等问题。

      近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队,联合中国中医科学院中药资源中心袁媛、黄璐琦团队,开发了迄今为止物种数量最多的叶绿体基因组综合数据库Chloroplast

    Genome Information Resource(CGIR)。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,包括利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组序列,按照基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功能模块对数据进行组织与管理。相关研究成果以Towards comprehensive integration and curation of chloroplast genomes为题,发表在Plant Biotechnology Journal上。

      根据生物物种名录(The Catalogue of

    Life),经过大规模人工审编,CGIR对所收录叶绿体基因组的物种分类信息进行审编,按照纲、目、科、属、种不同分类层级进行整理,并依据权威植物研究机构邱园发布的世界功能植物名录(World

    Checklist of Useful Plant

    Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行标注。同时,CGIR审编修正基因名的不规范命名、异名、错误注释等情况。在此基础上,CGIR系统整理各基因组的基因注释信息,为用户检索、浏览和信息获取提供便利。

      针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,同时,开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了科研人员开发分子标记的流程。

      CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。

      研究工作得到科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的支持。

  • 原文来源:http://www.cas.ac.cn/syky/202209/t20220922_4848447.shtml
相关报告
  • 《北京基因组所发布原核生物泛基因组数据库》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-10-31
    •   相比于传统的比较基因组学分析,泛基因组学为开展物种基因组动力学、分类及鉴定、致病性和环境适应等研究提供了新视角。近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的原核生物泛基因组数据库(ProPan)正式上线,旨在提供多物种的基因组动力学特征,为物种关键抗性和代谢相关基因鉴定及其演化规律研究提供重要的数据资源。相关研究成果以ProPan: a comprehensive database for profiling prokaryotic pan-genome dynamics为题,在线发表在Nucleic Acid Research上。   ProPan剖析了多个原核生物物种的基因组动力学特征,并进行了基因簇核苷酸多样性计算、COG功能富集分析、31个关键代谢循环过程及图谱构建、126种物质(包括杀菌剂、抗菌药物和金属)抗性基因预测和基因存在/缺失变异分析等。目前,ProPan收集了432个属的1504个物种(23个古细菌物种、1481个细菌物种)的51,882个基因组(295个古细菌基因组、51587个细菌基因组)和182867222个基因簇。用户可以以物种作为基本单元,进行数据的浏览、搜索和下载。   研究工作得到中国科学院战略性先导科技专项、国家自然科学基金、国家重点研发计划等的支持。
  • 《中国大豆“中黄13”基因组发布》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2018-08-03
    • 中国科学院遗传与发育生物学研究所联合中国科技大学、江苏省农业科学院种质资源与生物技术所、北京贝瑞和康生物技术有限公司等,对中国国审大豆品种“中黄13”(Gmax_ZH13)的基因组进行从头组装,最终得到1.025 Gb的基因组序列,包含20条染色体和1条叶绿体。相关成果近日以封面文章形式在线发表于《科学中国—生命科学》。 大豆起源于中国,古称“菽”,约在5000年前由其野生种驯化而来,随后广泛传播于世界各地。大豆在引种和改良过程中产生了遗传瓶颈效应,使来自不同主产区的大豆品种间具有显着的遗传变异。目前广泛采用的大豆参考基因组来源于美国品种“Williams 82”。该单一品种的基因组并不能完全代表所有大豆的遗传变异,特别是和美国地理距离遥远具有明显遗传变异的亚洲品种。此外,功能研究发现该基因组存在多处组装错误,影响了功能基因的定位挖掘。 合作团队综合运用单分子实时测序、单分子光学图谱和高通量染色体构象捕获技术,分析得出“中黄13”基因组Contig N50为3.46 Mb,Scaffold N50为51.87 Mb,是目前连续性最好的植物基因组之一。进一步分析,Gmax_ZH13和Williams 82基因组之间存在着大量的遗传变异,包括1404个易位事件、161个倒位事件、1233个倒位易位事件,以及在Gmax_ZH13中出现的505506个小插入/缺失和17409个大插入/缺失。 该研究整合大量转录组数据为Gmax_ZH13基因注释基因构建了一个完整的基因共表达网络,得到26个可能控制大豆开花时间的基因,并利用自然群体遗传变异和表型差异的关联对其中部分基因进行验证,为重要农艺性状基因的挖掘提供了新思路。Gmax_ZH13基因组的发表为大豆基础研究提供了重要资源,为国产优异大豆品种的培育奠定了基础。