《科学家构建涵盖五大植物类群的150+物种参考代谢组及数据库》

  • 来源专题:生物育种
  • 编译者: 季雪婧
  • 发布时间:2023-11-24
  •     11月11日,中国科学院分子植物科学卓越创新中心李轩团队在《核酸研究》(Nucleic Acids Research)上,在线发表了题为RefMetaPlant: reference metabolome database for plants across five major phyla的研究成果。该研究阐述了植物“参考代谢组”概念,发展了参考代谢组图谱的组装方法,完成构建了五大植物类群——苔藓植物、石松植物、蕨类植物、裸子植物和被子植物等类群的150多个植物物种的参考代谢组图谱。同时,该研究开发了一系列与基因组分析工具(如BLAST)相似的代谢组分析工具(如RefMetaBlast),为探讨植物代谢组多样性和代谢物功能,提供了数据共享和分析平台。

        植物“参考代谢组”是指一个植物物种所有代谢物的总和。一个植物物种“参考代谢组”与代谢物之间的关系,类似于植物物种“参考基因组”与基因之间的关系。在亿万年进化过程中,植物发展出惊人的化学多样性和代谢复杂性。植物对复杂多变的环境适应,形成种类繁多、结构高度复杂的代谢产物。这些代谢产物在植物生长、发育、生理调节和环境适应方面起到重要作用。据估计,绿色植物的代谢产物数量(包括初级代谢物和次级代谢物),达到百万以上。近年来,针对植物代谢组分析、解析代谢产物功能的挑战,随着代谢组检测技术的发展,如高分辨率质谱与超高效液相色谱相结合的分析技术,能够以高灵敏度、高分辨率、高准确性和高通量来检测代谢物,使在全组学规模的植物代谢物检测成为可能。与30年前多生物基因组计划开始时缺乏“参考基因组”和分析工具的状况类似,目前植物代谢组学研究缺乏高质量的植物“参考代谢组”及其相关分析工具。

        针对植物代谢组学研究的关键问题,该团队通过采集五大植物类群的多物种/多器官组织样本,基于高性能液质代谢组实验检测技术和人工智能深度代谢组分析算法,首次完成构建了涵盖绿色植物五大类群的150+植物物种的参考代谢组及数据库——RefMetaPlant。主要成果如下:涵盖植物五大类群150+植物物种的参考代谢组,且每个物种的参考代谢组 (.msr 或 .mgf 文件格式) 可在平台分析或下载;对每个植物物种的参考代谢组,提供基于人工智能分析的代谢物注释;用于代谢物注释的标准化合物谱图库及开发的一系列用于植物代谢组分析的工具,如LC-MS/MS Query、RefMetaBlast、CompoundLibBlast等。

        RefMetaPlant旨在提供标准化的植物参考代谢组,为植物代谢及植物生理相关研究提供关键支持。作为植物代谢组的综合数据库平台,RefMetaPlant将成为植物代谢组学研究的核心资源,将促进代谢组学领域的数据交流共享与合作。RefMetaPlant可在https://www.biosino.org/RefMetaDB免费使用。

        研究工作得到中国科学院战略性先导科技专项和国家自然科学基金的支持。

  • 原文来源:https://www.cas.cn/syky/202311/t20231115_4985677.shtml
相关报告
  • 《科学家构建植物微外显子数据库》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2025-08-20
    • 真核生物的基因通常包含可编码的外显子(exon)和不可编码的内含子(intron)。长度≤51个核苷酸(nt)的外显子被称为微外显子(microexon)。微外显子在多种生物学过程中发挥重要作用,能够增加转录本多样性、影响蛋白质结构,并参与调控网络的复杂化过程。在动物中,微外显子已被证实可以调控蛋白质结合域功能、参与发育过程并帮助生物适应环境变化。然而,植物中的微外显子,特别是长度≤15 nt的极小微外显子的研究较少。由于其长度过短,鉴定和功能研究存在困难,容易在基因组注释和转录组研究中缺失,导致基因结构模型错误。 前期,中国科学院昆明植物研究所喻辉辉等开发了精准鉴定植物微外显子的方法,发现植物微外显子具有特殊的剪接模式,在基因功能和系统进化中具有重要作用。同时,他们还开发了不依赖于转录组数据的植物微外显子预测方法,显著提高了基因组注释的准确性。 基于此,喻辉辉联合美国内布拉斯加大学教授Chi Zhang和Hongfeng Yu团队,成功构建了首个植物微外显子数据库MEPDB。 该数据库包含132个植物基因组的20,224个微外显子,主要功能包括: 1.?微外显子簇与物种浏览 数据库首页展示45个保守微外显子簇和132个植物物种列表,其中16个物种配有物种图片,并包含JBrowse基因组浏览器(10个物种包含RNA-seq数据)。用户可通过点击簇或物种名称查看对应微外显子的详细信息。 2.?微外显子详情展示 单个微外显子页面显示其ID、基因组坐标、长度、相位、微外显子标签序列等信息。数据整合自参考基因组注释、RNA-seq证据及MEPmodeler预测结果,并通过JBrowse可视化基因结构。 3.?在线预测工具 集成MEPmodeler在线预测服务,支持用户提交200nt至1Mb的基因组序列(粘贴或上传FASTA文件),返回微外显子位置、标签坐标及预测评分。结果可下载为CSV格式(含序列和评分)。 4.?数据下载功能 提供批量下载页面,包含全部20,224个微外显子的基本信息、注释、预测结果及RNA-seq数据,支持标准化格式以便整合至其他数据库。所有数据同步存档于Zenodo开放平台。 相关成果近期在线发表于《新植物学家》(New Phytologist)。
  • 《泛基因组数据库:找到油菜的“好基因”》

    • 来源专题:转基因生物新品种培育
    • 编译者:王晶静
    • 发布时间:2020-11-28
    • 油菜是世界第二大油料作物,也是我国最重要的油料作物之一。今年初,华中农业大学一支科研队伍公布了8个甘蓝型油菜的高质量参考基因组。近日,他们在原有研究基础上,通过整合1689份油菜的基因组及重测序数据,构建了首个油菜泛基因组和比较基因组生物信息平台BnPIR。 有了这一平台,研究人员可以更快捷、更方便地检索和使用油菜泛基因组相关资源。为何建设油菜泛基因组平台?这是一个什么样的数据库?油菜相关的多组学数据研究进展情况如何?《中国科学报》对此进行了采访。 “标准地图”有盲区 甘蓝型油菜大约在7500年前由白菜和甘蓝自然杂交形成,是非常“年轻”的多倍体植物。“多倍体物种,尤其是年轻的多倍体植物中,往往存在大量的非同源染色体重组事件,这些重组事件导致甘蓝型油菜内部的遗传变异非常丰富。”华中农业大学生物信息团队副教授杨庆勇说。 而在过去的几十年里,为了提高油菜的产量、品质及适应性等目标性状,国内外油菜遗传育种科学家持续地将白菜、芥菜等种质资源中控制重要性状(如抗性等)的遗传位点,通过杂交或者远缘杂交等手段导入到甘蓝型油菜中,进一步丰富了其物种的遗传多样性。“现有的研究数据表明,甘蓝型油菜基因组中7成以上基因都存在大的遗传变异,也就是通常所说的结构变异。换句话说,对于油菜这样的年轻多倍体物种,单一参考基因组往往无法很好地包含物种内丰富的遗传变异信息。”杨庆勇进一步解释道。 如何系统挖掘和揭示甘蓝型油菜的遗传变异? 杨庆勇介绍,传统的遗传变异检测手段主要通过基因组重测序,然后将重测序的读段比对到参考基因组,可以称之为“按图索异”。这里的图是指参考基因组(参考基因组作为生命科学研究中的“标准地图”),而我们目前使用的“标准地图”(单一参考基因组)仍然存在大量的“暗区和盲区”。单一参考基因组为重要性状相关遗传位点和基因的挖掘与利用设置了重重障碍。为了克服这些困难,科学家提出了通过整合多个代表性种质资源的基因组信息,构建泛基因组的研究思路和策略。 首个油菜泛基因组 甘蓝型油菜是研究植物多倍化和进化的模式物种。遗憾的是,甘蓝型油菜一直缺乏专门的基因组数据库,研究人员不得不借助芸薹属数据库(BRAD)和其他公共数据库(Genoscope和Ensembl等)来获取甘蓝型油菜的基因组数据。“这些数据库是基于单一品种基因组和注释,并且缺乏多组学数据和群体变异信息。” 华中农业大学生物信息团队教授陈玲玲说。 据介绍,整合多种个体的泛基因组可以更加全面的检测物种内部的遗传变异,获得各个样本的共有和特有的基因集,结合不同样本的表型差异可以为进一步挖掘重要的农艺性状基因提供基础。 2020年1月,华中农业大学油菜团队与生物信息团队合作,在《自然—植物》上发布了8个甘蓝型油菜种质基因组序列,并通过比较基因组分析鉴定了大量SNPs(单碱基多态性)、PAVs(存在/缺失变异)等变异,构建了大小约为1.8Gb泛基因组,包含约15万个基因。通过基于PAVs的全基因组关联分析直接鉴定到了与角果长度、种子重量和开花时间相关的结构变异。研究发现,多个FLC基因上的PAVs与开花时间和生态型分化紧密相关。 华中农业大学油菜团队教授刘克德介绍,该研究为进一步解析甘蓝型油菜的基因组结构和加速遗传改良提供了资源,泛基因组的建立对鉴定与重要农艺性状关联的结构变异有重要意义。为了让油菜遗传育种研究人员能够快捷、方便地检索和使用油菜泛基因组相关资源,研究人员进一步结合1689份油菜的基因组及重测序数据,构建了甘蓝型油菜泛基因组数据库BnPIR。相关论文10月17日在线发表于《植物生物技术杂志》。 泛基因组数据库BnPIR 杨庆勇介绍,BnPIR是基于基因信息模块的综合平台,以泛基因组浏览器和多基因组共线性为核心,包含多组学数据和常见的生物信息学工具。BnPIR包含基因组序列、基因注释、系统发育关系、表达数据、PAVs 信息、基因分类,品种信息和常用多组学工具,并提供快速搜索和可视化的集成。BnPIR为油菜分子生物学和育种提供丰富资源,有助于油菜研究人员在泛基因组背景下搜索和可视化其结果,并为其他物种的泛基因组分析提供有价值的模板和平台。同时,研究人员也指出,“目前我们用于构建泛基因组的代表性油菜品系仅9个,未来将收集、组装和收集更多代表性油菜品系的基因组及其变异信息,整合到BnPIR泛基因组数据库中。”此外,除了主要聚焦在检索变异层面的BnPIR,现在他们还已完成了基于图形结构泛基因组的构建,并应用这个新构建的泛基因组进行全基因组关联分析及进化分析等研究工作。 当前,我国科学家在十字花科作物育种领域发表外文论文总量排名世界第一,并且产生了大量优良的遗传材料,以及基因组、转录组和代谢组等多组学数据。如何实现多组学数据复用和共享,将数据转化成知识、专利、品种及生产力,一直是科研人员思考和努力的方向。“泛基因组数据库仅仅是个开端,目前我们与国内的多个油菜研究团队合作,已经完成了油菜泛转录组数据库的构建,很快就会与大家见面。油菜代谢组数据库相关构建工作也已开展。”华中农业大学油菜团队教授郭亮说。华中农大的研究人员希望,未来通过与国内油菜科学家更加紧密的交流与合作,为油菜遗传育种提供更加系统全面、准确高效和友好的数据库和生物信息平台服务工作。 相关论文信息:https://doi.org/10.1038/s41477-019-0577-7;https://doi.org/10.1111/pbi.13491