《北京基因组所等开发出叶绿体基因组综合数据库》

  • 来源专题:转基因生物新品种培育
  • 编译者: 姜丽华
  • 发布时间:2022-10-31
  •       叶绿体是植物将光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,被广泛应用于植物系统进化关系研究、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,但如何整合应用这些数据目前仍面临数据命名标准不统一、数据信息不全以及较高经济价值的物种尚未进行测序等问题。

      近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队,联合中国中医科学院中药资源中心袁媛、黄璐琦团队,开发了迄今为止物种数量最多的叶绿体基因组综合数据库Chloroplast

    Genome Information Resource(CGIR)。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,包括利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组序列,按照基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功能模块对数据进行组织与管理。相关研究成果以Towards comprehensive integration and curation of chloroplast genomes为题,发表在Plant Biotechnology Journal上。

      根据生物物种名录(The Catalogue of

    Life),经过大规模人工审编,CGIR对所收录叶绿体基因组的物种分类信息进行审编,按照纲、目、科、属、种不同分类层级进行整理,并依据权威植物研究机构邱园发布的世界功能植物名录(World

    Checklist of Useful Plant

    Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行标注。同时,CGIR审编修正基因名的不规范命名、异名、错误注释等情况。在此基础上,CGIR系统整理各基因组的基因注释信息,为用户检索、浏览和信息获取提供便利。

      针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,同时,开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了科研人员开发分子标记的流程。

      CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。

      研究工作得到科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的支持。

  • 原文来源:http://www.cas.ac.cn/syky/202209/t20220922_4848447.shtml
相关报告
  • 《北京基因组所发布原核生物泛基因组数据库》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-10-31
    •   相比于传统的比较基因组学分析,泛基因组学为开展物种基因组动力学、分类及鉴定、致病性和环境适应等研究提供了新视角。近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的原核生物泛基因组数据库(ProPan)正式上线,旨在提供多物种的基因组动力学特征,为物种关键抗性和代谢相关基因鉴定及其演化规律研究提供重要的数据资源。相关研究成果以ProPan: a comprehensive database for profiling prokaryotic pan-genome dynamics为题,在线发表在Nucleic Acid Research上。   ProPan剖析了多个原核生物物种的基因组动力学特征,并进行了基因簇核苷酸多样性计算、COG功能富集分析、31个关键代谢循环过程及图谱构建、126种物质(包括杀菌剂、抗菌药物和金属)抗性基因预测和基因存在/缺失变异分析等。目前,ProPan收集了432个属的1504个物种(23个古细菌物种、1481个细菌物种)的51,882个基因组(295个古细菌基因组、51587个细菌基因组)和182867222个基因簇。用户可以以物种作为基本单元,进行数据的浏览、搜索和下载。   研究工作得到中国科学院战略性先导科技专项、国家自然科学基金、国家重点研发计划等的支持。
  • 《动物所开发出新型TnpB微型基因编辑工具》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2023-07-06
    •     CRISPR-Cas技术促进生物医学研究。除了广泛使用的Cas9系统之外,其他CRISPR亚型也不断被发现并应用于基因编辑,例如能够装载进AAV病毒的SaCas9(1053 aa)以及更小的微型CRISPR-Cas系统Cas12f(400~550 aa)。已发表的工作重建了CRISPR-Cas系统的起源,发现了原核转座子编码的IscB和TnpB蛋白分别是Cas9与Cas12核酸酶的祖先。这些祖先蛋白尺寸较小,但是否具备核酸酶活性缺乏证据;直到2021年,IscB和TnpB被发现在非编码RNA     (omegaRNA或reRNA)引导下切割双链DNA,证实了其与CRISPR-Cas系统相似的工作机制。TnpB由IS200/IS605等原核转座子家族编码,并被推测参与转座子的扩张。TnpB的分布非常广泛,在目前已知的基因组存在超过百万的拷贝;而此前研究只发现了一种在人类细胞中具有活性的TnpB核酸酶(ISDra2),且效率不高;因此,TnpB这一有潜力作为微型编辑工具的多样性宝库急需系统性的挖掘和研究。同时,由于可能推动转座子扩张,TnpB靶向切割DNA所依赖的关键元件(如reRNA)与转座子或存在关联,因而可以基于转座子信息进行预测,这将为工具的开发提供便利。     6月29日,中国科学院动物研究所/北京干细胞与再生医学研究院研究员王皓毅、博士项光海和动物所研究员张勇团队合作,在《自然-生物技术》(Nature Biotechnology)上,在线发表了题为Evolutionary mining and functional characterization of TnpB nucleases identify efficient miniature genome editors的研究论文。《自然-生物技术》同时发表了Research Briefing文章,对该成果进行总结和展望(Hypercompact genome editors are discovered by mining a transposon family)。该研究创新性地建立了对TnpB相关靶向基因编辑系统的大规模挖掘方法,并首次对多样性极其丰富的TnpB核酸酶进行了大规模挖掘,从而鉴定到33个在原核系统具有靶向编辑活性的TnpB蛋白,其中5个在真核系统具有活性。     研究对ISfinder原核转座子数据库中IS605编码的TnpB蛋白进行了全面的分析和挖掘,从64个候选项中鉴定出25种在大肠杆菌中活跃的系统,其中3种在人类细胞中具有基因编辑活性。该工作对功能数据的进一步分析揭示了TnpB蛋白相关的reRNA骨架与IS200/IS605转座子的RE序列具有完全重叠的3’末端,而TAM序列则与转座子上游的插入位点序列相同。研究表明,在TnpB系统中,与RNA介导的编辑器相关的三大要素(核酸酶、gRNA骨架和TAM序列)均可通过生物信息分析准确预测,这为大规模筛选高活性TnpB核酸酶奠定了基础。这一发现同时进一步确定了TnpB在IS605中的功能,即作为归巢核酸酶切割转座之后的原位点,从而诱导重组修复实现转座子的拷贝数扩增。 进一步,该团队从4个方面对TnpB相关的reRNA骨架进行了分析。结果表明:reRNA骨架在120-300nt的长度范围内均能够有效发挥功能,而120-140nt的reRNA骨架活性最强;reRNA骨架在3’末端的碱基对其功能有重要影响,单一碱基的突变即会显著降低编辑活性;靶向序列的长度在16-20nt为最佳;靠近TAM端的12nt是TnpB编辑器的核心序列。研究进一步整合分析了影响TnpB编辑器活性的潜在因素,发现了来自细菌的、由多拷贝转座子编码的、具有完整蛋白结构域和保守氨基酸的TnpB编辑器更为活跃。     该团队基于上述研究,建立了大规模挖掘全新TnpB基因编辑器的方法(如图),对部分未经转座子注释的原核基因组进行了从头注释和功能预测,并直接在人类细胞系中筛选获得了新的微型高活性TnpB编辑器ISAam1(369 aa)和ISYmu1(382 aa)。与其他微型Cas蛋白的平行比较发现,ISAam1和ISYmu1的活性与SaCas9相当,显著高于数种已报道的Cas12f蛋白及其变体。     综上,该研究建立了适用于TnpB编辑器的大规模筛选体系,进一步证明了TnpB在转座子扩张中的功能,并对这一类编辑器进行了系统的功能解析,从而获得了目前最小的具备原创知识产权的微型基因编辑器。考虑到体内基因治疗和细胞治疗经常因Cas蛋白过大而递送受限,这一成果将推动相关方面的研究和临床应用。     王皓毅致力于新型基因编辑工具的开发及CAR-T细胞治疗研究;张勇致力于转座子等机制介导的新重复基因的起源和进化研究。两个团队的合作推动了对TnpB的挖掘。研究工作得到科学技术部、中国科学院战略性先导科技专项、农业农村部和国家自然科学基金委员会等的支持。