《科学家构建植物微外显子数据库》

  • 来源专题:生物育种
  • 编译者: 季雪婧
  • 发布时间:2025-08-20
  • 真核生物的基因通常包含可编码的外显子(exon)和不可编码的内含子(intron)。长度≤51个核苷酸(nt)的外显子被称为微外显子(microexon)。微外显子在多种生物学过程中发挥重要作用,能够增加转录本多样性、影响蛋白质结构,并参与调控网络的复杂化过程。在动物中,微外显子已被证实可以调控蛋白质结合域功能、参与发育过程并帮助生物适应环境变化。然而,植物中的微外显子,特别是长度≤15 nt的极小微外显子的研究较少。由于其长度过短,鉴定和功能研究存在困难,容易在基因组注释和转录组研究中缺失,导致基因结构模型错误。

    前期,中国科学院昆明植物研究所喻辉辉等开发了精准鉴定植物微外显子的方法,发现植物微外显子具有特殊的剪接模式,在基因功能和系统进化中具有重要作用。同时,他们还开发了不依赖于转录组数据的植物微外显子预测方法,显著提高了基因组注释的准确性。

    基于此,喻辉辉联合美国内布拉斯加大学教授Chi Zhang和Hongfeng Yu团队,成功构建了首个植物微外显子数据库MEPDB。

    该数据库包含132个植物基因组的20,224个微外显子,主要功能包括:

    1.?微外显子簇与物种浏览

    数据库首页展示45个保守微外显子簇和132个植物物种列表,其中16个物种配有物种图片,并包含JBrowse基因组浏览器(10个物种包含RNA-seq数据)。用户可通过点击簇或物种名称查看对应微外显子的详细信息。

    2.?微外显子详情展示

    单个微外显子页面显示其ID、基因组坐标、长度、相位、微外显子标签序列等信息。数据整合自参考基因组注释、RNA-seq证据及MEPmodeler预测结果,并通过JBrowse可视化基因结构。

    3.?在线预测工具

    集成MEPmodeler在线预测服务,支持用户提交200nt至1Mb的基因组序列(粘贴或上传FASTA文件),返回微外显子位置、标签坐标及预测评分。结果可下载为CSV格式(含序列和评分)。

    4.?数据下载功能

    提供批量下载页面,包含全部20,224个微外显子的基本信息、注释、预测结果及RNA-seq数据,支持标准化格式以便整合至其他数据库。所有数据同步存档于Zenodo开放平台。

    相关成果近期在线发表于《新植物学家》(New Phytologist)。

  • 原文来源:http://www.cas.cn/syky/202508/t20250820_5079948.shtml
相关报告
  • 《科学家构建涵盖五大植物类群的150+物种参考代谢组及数据库》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2023-11-24
    •     11月11日,中国科学院分子植物科学卓越创新中心李轩团队在《核酸研究》(Nucleic Acids Research)上,在线发表了题为RefMetaPlant: reference metabolome database for plants across five major phyla的研究成果。该研究阐述了植物“参考代谢组”概念,发展了参考代谢组图谱的组装方法,完成构建了五大植物类群——苔藓植物、石松植物、蕨类植物、裸子植物和被子植物等类群的150多个植物物种的参考代谢组图谱。同时,该研究开发了一系列与基因组分析工具(如BLAST)相似的代谢组分析工具(如RefMetaBlast),为探讨植物代谢组多样性和代谢物功能,提供了数据共享和分析平台。     植物“参考代谢组”是指一个植物物种所有代谢物的总和。一个植物物种“参考代谢组”与代谢物之间的关系,类似于植物物种“参考基因组”与基因之间的关系。在亿万年进化过程中,植物发展出惊人的化学多样性和代谢复杂性。植物对复杂多变的环境适应,形成种类繁多、结构高度复杂的代谢产物。这些代谢产物在植物生长、发育、生理调节和环境适应方面起到重要作用。据估计,绿色植物的代谢产物数量(包括初级代谢物和次级代谢物),达到百万以上。近年来,针对植物代谢组分析、解析代谢产物功能的挑战,随着代谢组检测技术的发展,如高分辨率质谱与超高效液相色谱相结合的分析技术,能够以高灵敏度、高分辨率、高准确性和高通量来检测代谢物,使在全组学规模的植物代谢物检测成为可能。与30年前多生物基因组计划开始时缺乏“参考基因组”和分析工具的状况类似,目前植物代谢组学研究缺乏高质量的植物“参考代谢组”及其相关分析工具。     针对植物代谢组学研究的关键问题,该团队通过采集五大植物类群的多物种/多器官组织样本,基于高性能液质代谢组实验检测技术和人工智能深度代谢组分析算法,首次完成构建了涵盖绿色植物五大类群的150+植物物种的参考代谢组及数据库——RefMetaPlant。主要成果如下:涵盖植物五大类群150+植物物种的参考代谢组,且每个物种的参考代谢组 (.msr 或 .mgf 文件格式) 可在平台分析或下载;对每个植物物种的参考代谢组,提供基于人工智能分析的代谢物注释;用于代谢物注释的标准化合物谱图库及开发的一系列用于植物代谢组分析的工具,如LC-MS/MS Query、RefMetaBlast、CompoundLibBlast等。     RefMetaPlant旨在提供标准化的植物参考代谢组,为植物代谢及植物生理相关研究提供关键支持。作为植物代谢组的综合数据库平台,RefMetaPlant将成为植物代谢组学研究的核心资源,将促进代谢组学领域的数据交流共享与合作。RefMetaPlant可在https://www.biosino.org/RefMetaDB免费使用。     研究工作得到中国科学院战略性先导科技专项和国家自然科学基金的支持。
  • 《青岛建立近海超微型浮游植物丰度数据库》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:mall
    • 发布时间:2017-10-18
    • 牛!青岛开发出新技术 将牵头制定“国家标准”   记者10月10日从青岛生物能源与过程研究所获悉,该所海洋碳汇团队在蓝色碳汇评估技术方面获得重要进展,建立了一套中国近海超微型浮游植物丰度数据库,并探索开发了一种揭示海洋超微型浮游植物固碳量的新的科学评估技术方法。   近日,在国家海洋局公布的14项海洋行业标准制修订计划项目当中,青能所获得立项将牵头编制《蓝色碳汇调查监测与计量技术规程:超微型浮游植物》,服务于我国蓝色碳汇和海洋低碳经济发展。   据青能所海洋碳汇团队负责人张永雨研究员介绍,海洋在固定大气二氧化碳、减缓气候变化方面起到了重要的作用,是地球上最大的碳汇。为推动蓝色碳汇发展,我国科学家前期自发成立了全国海洋碳汇联盟和中国未来海洋联合会,并适时推出了中国蓝碳计划。   据了解,地球上人类呼吸所需的氧气,一半是来自于海洋,而且主要来自超微型浮游植物光合固碳与放氧作用。   超微型浮游植物包括原绿球藻、聚球藻、超微型真核藻类等类群,它们是海洋中丰度最高、生物量最大的光合自养生物,大洋寡营养海域总固碳量的80%以上是由超微型浮游植物所贡献。   超微型浮游植物固碳量的研究与科学计量对于揭示和评估海洋在应对气候变化中的贡献具有重要意义,但目前因研究技术和方法所限,关于海洋超微型浮游植物固碳量的认识仅来自于少数海域,难以实现海洋中大范围尺度的调查评估。   青能所海洋碳汇团队目前建立了一套中国近海超微型浮游植物丰度数据库,通过研究典型近海与大洋环境中超微型浮游植物生物量的环境调控机制,探索出了一种全新的海洋超微型浮游植物固碳量评估方法。   该方法结合海洋航次调查、数学模型构建、有机碳定性定量等技术,以及固碳趋势对海洋不同深度光辐射的反应等不同参数,实现了海洋中超微型浮游植物的固碳量的科学估量。   团队梁彦韬博士以渤海湾为例,估算得出渤海超微型浮游植物年固碳量约150万吨。该研究将服务于中国蓝碳计划,并为将来全球尺度上海洋超微型浮游植物固碳量的调查监测与计量评估标准技术体系的建立奠定了重要基础。