《科学家构建涵盖五大植物类群的150+物种参考代谢组及数据库》

  • 来源专题:生物育种
  • 编译者: 季雪婧
  • 发布时间:2023-11-24
  •     11月11日,中国科学院分子植物科学卓越创新中心李轩团队在《核酸研究》(Nucleic Acids Research)上,在线发表了题为RefMetaPlant: reference metabolome database for plants across five major phyla的研究成果。该研究阐述了植物“参考代谢组”概念,发展了参考代谢组图谱的组装方法,完成构建了五大植物类群——苔藓植物、石松植物、蕨类植物、裸子植物和被子植物等类群的150多个植物物种的参考代谢组图谱。同时,该研究开发了一系列与基因组分析工具(如BLAST)相似的代谢组分析工具(如RefMetaBlast),为探讨植物代谢组多样性和代谢物功能,提供了数据共享和分析平台。

        植物“参考代谢组”是指一个植物物种所有代谢物的总和。一个植物物种“参考代谢组”与代谢物之间的关系,类似于植物物种“参考基因组”与基因之间的关系。在亿万年进化过程中,植物发展出惊人的化学多样性和代谢复杂性。植物对复杂多变的环境适应,形成种类繁多、结构高度复杂的代谢产物。这些代谢产物在植物生长、发育、生理调节和环境适应方面起到重要作用。据估计,绿色植物的代谢产物数量(包括初级代谢物和次级代谢物),达到百万以上。近年来,针对植物代谢组分析、解析代谢产物功能的挑战,随着代谢组检测技术的发展,如高分辨率质谱与超高效液相色谱相结合的分析技术,能够以高灵敏度、高分辨率、高准确性和高通量来检测代谢物,使在全组学规模的植物代谢物检测成为可能。与30年前多生物基因组计划开始时缺乏“参考基因组”和分析工具的状况类似,目前植物代谢组学研究缺乏高质量的植物“参考代谢组”及其相关分析工具。

        针对植物代谢组学研究的关键问题,该团队通过采集五大植物类群的多物种/多器官组织样本,基于高性能液质代谢组实验检测技术和人工智能深度代谢组分析算法,首次完成构建了涵盖绿色植物五大类群的150+植物物种的参考代谢组及数据库——RefMetaPlant。主要成果如下:涵盖植物五大类群150+植物物种的参考代谢组,且每个物种的参考代谢组 (.msr 或 .mgf 文件格式) 可在平台分析或下载;对每个植物物种的参考代谢组,提供基于人工智能分析的代谢物注释;用于代谢物注释的标准化合物谱图库及开发的一系列用于植物代谢组分析的工具,如LC-MS/MS Query、RefMetaBlast、CompoundLibBlast等。

        RefMetaPlant旨在提供标准化的植物参考代谢组,为植物代谢及植物生理相关研究提供关键支持。作为植物代谢组的综合数据库平台,RefMetaPlant将成为植物代谢组学研究的核心资源,将促进代谢组学领域的数据交流共享与合作。RefMetaPlant可在https://www.biosino.org/RefMetaDB免费使用。

        研究工作得到中国科学院战略性先导科技专项和国家自然科学基金的支持。

  • 原文来源:https://www.cas.cn/syky/202311/t20231115_4985677.shtml
相关报告
  • 《科学家构建植物微外显子数据库》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2025-08-20
    • 真核生物的基因通常包含可编码的外显子(exon)和不可编码的内含子(intron)。长度≤51个核苷酸(nt)的外显子被称为微外显子(microexon)。微外显子在多种生物学过程中发挥重要作用,能够增加转录本多样性、影响蛋白质结构,并参与调控网络的复杂化过程。在动物中,微外显子已被证实可以调控蛋白质结合域功能、参与发育过程并帮助生物适应环境变化。然而,植物中的微外显子,特别是长度≤15 nt的极小微外显子的研究较少。由于其长度过短,鉴定和功能研究存在困难,容易在基因组注释和转录组研究中缺失,导致基因结构模型错误。 前期,中国科学院昆明植物研究所喻辉辉等开发了精准鉴定植物微外显子的方法,发现植物微外显子具有特殊的剪接模式,在基因功能和系统进化中具有重要作用。同时,他们还开发了不依赖于转录组数据的植物微外显子预测方法,显著提高了基因组注释的准确性。 基于此,喻辉辉联合美国内布拉斯加大学教授Chi Zhang和Hongfeng Yu团队,成功构建了首个植物微外显子数据库MEPDB。 该数据库包含132个植物基因组的20,224个微外显子,主要功能包括: 1.?微外显子簇与物种浏览 数据库首页展示45个保守微外显子簇和132个植物物种列表,其中16个物种配有物种图片,并包含JBrowse基因组浏览器(10个物种包含RNA-seq数据)。用户可通过点击簇或物种名称查看对应微外显子的详细信息。 2.?微外显子详情展示 单个微外显子页面显示其ID、基因组坐标、长度、相位、微外显子标签序列等信息。数据整合自参考基因组注释、RNA-seq证据及MEPmodeler预测结果,并通过JBrowse可视化基因结构。 3.?在线预测工具 集成MEPmodeler在线预测服务,支持用户提交200nt至1Mb的基因组序列(粘贴或上传FASTA文件),返回微外显子位置、标签坐标及预测评分。结果可下载为CSV格式(含序列和评分)。 4.?数据下载功能 提供批量下载页面,包含全部20,224个微外显子的基本信息、注释、预测结果及RNA-seq数据,支持标准化格式以便整合至其他数据库。所有数据同步存档于Zenodo开放平台。 相关成果近期在线发表于《新植物学家》(New Phytologist)。
  • 《武汉植物园等公布水生植物莲的基因组遗传变异与表达数据库》

    • 来源专题:转基因生物新品种培育
    • 编译者:王晶静
    • 发布时间:2021-03-04
    • 莲为水生植物,俗称荷花(莲科莲属),莲的起源较早,对研究被子植物(有花植物)的起源与演化具有重要的指导意义。在实际生产中,莲花色、花型丰富多样,且赋予了特殊的文化内涵,在园林景观中应用广泛;兼具食用、药用等重要价值,引发学界关注。基于此,中国科学院武汉植物园水生植物生物地理学学科组与武汉市园林科学研究院科研人员合作,构建了莲的基因组遗传变异与表达数据库Nelumbo Genome Database(NGD)。 NGD部署了我国古代莲基于HI-C技术的染色体水平基因组组装序列,收录了注释到的150,589个mRNA转录本异构体和34,481个具有完整开放阅读框的基因,为破解莲分子遗传机理提供了“关键钥匙”。该数据库整合了公共数据库中莲的11个组织在不同时期的共63个转录组基因表达数据,并构建了加权基因共表达网络,涵盖了不同器官(组织)类型发育调控以及同一组织不同发育调控过程中协同表达的基因模块(module),为了解莲的基因表达调控规律提供了重要的公共分析平台。此外,该数据库还对荷花中具有代表性的88个栽培种表型性状进行了数字化,并基于实验室内部及此前已发表的基因组重测序数据,相应鉴定了26,939,834个高质量单核苷酸多态性变异位点和4,177,974个插入缺失变异位点,丰富了莲的遗传变异信息。该数据库部署了包含Blast、Gbrowse、Primer Design和Expression Visualization在内的多个生物信息学工具,使莲的基因序列、功能及表达的相关信息更易获取。该公共数据平台为展开莲的基因组进化、分子遗传和分子育种等领域的研究及实验设计提供了参考信息。 该数据库及相关研究成果以Nelumbo genome database, an integrative resource for gene expression and variants of Nelumbo nucifera为题,在线发表在Scientific Data上。武汉植物园博士李会和武汉市园林科学研究院博士杨星宇为论文并列第一作者,中国科学院水生植物与流域生态重点实验室副研究员石涛和研究员陈进明为论文共同通讯作者。研究工作得到中国科学院战略重点研究计划、国家自然科学基金、中国科学院青年创新促进会、武汉市园林和林业局、湖北省自然科学基金和湖北省青年科技晨光计划的支持。