《基因组研究所张兴坦团队发布了首个榕属植物对叶榕端粒到端粒完整基因组》

  • 来源专题:生物育种
  • 编译者: 季雪婧
  • 发布时间:2024-03-13
  •     近日,中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)张兴坦团队发布了首个榕属植物对叶榕端粒到端粒完整基因组,修正了原有基因组中存在的大量的间隙和组装错误,大幅提升了对叶榕基因组的连续性、完整性和准确性。相关研究成果发表在《园艺研究(Horticulture research)》上。

        榕树是桑科榕属800多种植物的统称,广泛分布于热带和亚热带地区,榕属植物包含6个亚属,分别是白肉榕亚属、榕亚属、无花果亚属、糙叶榕亚属、聚果榕亚属和薜荔榕亚属,其中对叶榕(Ficus hispida)属于聚果榕亚属,是典型的功能雌雄异株植物,解析对叶榕基因组对生物学性状解析和基因功能的研究至关重要,然而,原有基因组中存在大量的信息缺失和组装错误,阻碍了进一步研究。

        因此,研究团队综合利用Pacbio HiFi、Oxford Nanopore ultra-long和Hi-C等多种测序技术,在原有基因组基础上重新组装、完善,发布了首个榕属植物对叶榕端粒到端粒(T2T)完整基因组,该基因组大小371.8Mb,N50为23.1Mb,所有序列均挂载到14条染色体上,成功注释了26642个编码蛋白基因,经评估,基因组完整度达98.7%,对叶榕T2T基因组的连续性、完整性和准确性均得到了大幅提升。

        在此基础上,研究基于不同性别的重测序数据reads覆盖度、Fst和Pi分析,将之前报道的 2Mb 雄性特异性区域扩展为 7.2 Mb区域(图2B和2C),该区域包含96.39%的重复序列。基因注释显示,该区域包含53个编码蛋白基因,除了之前报道的性别决定候选MADS-box基因AG2和AG3外,新预测了51个基因。基因拷贝数研究显示在常染色体区域还存在一个MADS-box蛋白基因AG1。转录组数据分析发现,AG2和AG3在雄花不同发育时期高表达,雄性特异区域的基因表达极低,而AG1在不同性别不同组织中均有表达(图2D),说明AG2和AG3是控制雄花发育的关键基因;进一步的甲基化分析发现,雄性特异区域基因的基因体和启动子区域均呈现高甲基化状态(图2E),表明甲基化可能影响了该区域基因的表达。基于基因表达谱,通过mutual ranking算法构建了雄性和雌性花不同发育时期的基因调控网络;调控网络揭示AG2和AG3调控雄蕊发育,AG1基因主要负责调控雌花的防御反应和次生代谢过程。本研究首次完成了榕属对叶榕完整的T2T基因组和性别决定区域,进一步确定了性别候选基因,为研究榕属植物重要特征和性别决定提供了重要资源。


  • 原文来源:https://www.ebiotrade.com/newsf/2024-3/20240302064930145.htm
相关报告
  • 《榕属叶绿体基因组比较研究获进展》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-12-05
    •       近年来,叶绿体基因组因基因组小、突变率和重组率低的特点,被广泛用于植物系统发育、分子进化、谱系地理学的研究。榕属(Ficus)作为桑科的最大属,且是热带雨林的关键物种,而其系统发育关系仍需进一步研究。榕属物种具有多样的生态型,体现了对不同生境的高度适应性。尽管近年来关于榕属叶绿体基因组的研究有所发展,但缺少基于较大样本量的全属水平的叶绿体基因组的结构变异及系统进化的分析。   中国科学院西双版纳热带植物园协同进化研究组与吉林农业大学合作,对囊括了6个榕亚属的24种叶绿体基因组进行全面分析,揭示了基因组中的高变区域以及蛋白编码基因的选择进化模式。研究进一步结合先前发表的40个榕属叶绿体基因组,进行了系统发育分析和物种分化时间的估算。结果表明:榕属叶绿体基因组在结构上具有很高的保守性,鉴定到8个分化热点区域,为区分近缘种以及群体水平的谱系地理分析提供候选区域。三个蛋白编码基因(clpP、rbcL、ccsA)受到正选择作用,或有助于不同生活型的榕树对不同生境的适应,其余蛋白质编码基因均经历了纯化选择。同时,基于叶绿体基因组数据构建的系统发育树为解决榕属植物的系统发育提供了新见解。叶绿体基因组的分化时间估计则与基于核基因的分化时间相似,约起源于74.5百万年前,快速分化于中新世早期至中期,这一时间与中新世早期的全球变暖和中新世气候适宜期相吻合。   相关研究成果以Comparative chloroplast genome analysis of Ficus (Moraceae): Insight into adaptive evolution and mutational hotspot regions为题,发表在Frontiers in Plant Science上。研究工作得到中国科学院“西部之光”人才培养计划“西部青年学者”项目、云南省基础研究计划项目和国家自然科学基金的支持。
  • 《北京基因组所等开发出叶绿体基因组综合数据库》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-10-31
    •       叶绿体是植物将光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,被广泛应用于植物系统进化关系研究、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,但如何整合应用这些数据目前仍面临数据命名标准不统一、数据信息不全以及较高经济价值的物种尚未进行测序等问题。   近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队,联合中国中医科学院中药资源中心袁媛、黄璐琦团队,开发了迄今为止物种数量最多的叶绿体基因组综合数据库Chloroplast Genome Information Resource(CGIR)。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,包括利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组序列,按照基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功能模块对数据进行组织与管理。相关研究成果以Towards comprehensive integration and curation of chloroplast genomes为题,发表在Plant Biotechnology Journal上。   根据生物物种名录(The Catalogue of Life),经过大规模人工审编,CGIR对所收录叶绿体基因组的物种分类信息进行审编,按照纲、目、科、属、种不同分类层级进行整理,并依据权威植物研究机构邱园发布的世界功能植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行标注。同时,CGIR审编修正基因名的不规范命名、异名、错误注释等情况。在此基础上,CGIR系统整理各基因组的基因注释信息,为用户检索、浏览和信息获取提供便利。   针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,同时,开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了科研人员开发分子标记的流程。   CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。   研究工作得到科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的支持。