《GSA:组学原始数据库系统》

  • 来源专题:转基因生物新品种培育
  • 编译者: Zhao
  • 发布时间:2017-03-13
  • 生命科学的发展已进入组学大数据时代,然而中国至今尚未形成可服务于科学研究的公共数据库存储体系。为了弥补这一空白,中国科学院北京基因组研究所生命与健康大数据中心开发并构建了组学原始数据存储归档系统 Genome Sequence Archive (简称 GSA ; http://bigd.big.ac.cn/gsa 或 http://gsa.big.ac.cn )。 GSA 的系统建设遵循了国际核酸序列共享联盟( International Nucleotide Sequence Database Collaboration, INSDC )的相关标准,并作为 INSDC 的补充,旨在减轻国际相关数据库数据存贮及数据传输的压力;立足中国,服务全球。

相关报告
  • 《北京基因组所等开发出叶绿体基因组综合数据库》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-10-31
    •       叶绿体是植物将光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,被广泛应用于植物系统进化关系研究、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,但如何整合应用这些数据目前仍面临数据命名标准不统一、数据信息不全以及较高经济价值的物种尚未进行测序等问题。   近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队,联合中国中医科学院中药资源中心袁媛、黄璐琦团队,开发了迄今为止物种数量最多的叶绿体基因组综合数据库Chloroplast Genome Information Resource(CGIR)。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,包括利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组序列,按照基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功能模块对数据进行组织与管理。相关研究成果以Towards comprehensive integration and curation of chloroplast genomes为题,发表在Plant Biotechnology Journal上。   根据生物物种名录(The Catalogue of Life),经过大规模人工审编,CGIR对所收录叶绿体基因组的物种分类信息进行审编,按照纲、目、科、属、种不同分类层级进行整理,并依据权威植物研究机构邱园发布的世界功能植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行标注。同时,CGIR审编修正基因名的不规范命名、异名、错误注释等情况。在此基础上,CGIR系统整理各基因组的基因注释信息,为用户检索、浏览和信息获取提供便利。   针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,同时,开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了科研人员开发分子标记的流程。   CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。   研究工作得到科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的支持。
  • 《全球首个能源草多组学数据库建成》

    • 来源专题:能源情报网监测服务平台
    • 编译者:郭楷模
    • 发布时间:2025-02-21
    • 记者2月17日从福建农林大学获悉,由该校教授朱方捷团队领衔的研究团队成功开发出全球首个能源草多组学数据库。作为能源草研究目前最完善的综合数据平台,该数据库将推进能源草科学研究及其种质创新,加快实现“双碳”目标。相关成果日前发表于国际期刊《宏基因组与生物信息》。 能源草并非一种特定植物的名称,而是一类具有快速生长、产量高、适应性强等特点的植物的统称,广泛应用于生物质能源、生态修复等领域。“能源草多组学数据库涵盖11种广泛应用的能源草,收录基因组、表观基因组、转录组、表型组等多组学大数据。针对目前能源草表观基因组数据稀缺的问题,项目团队还首次系统绘制了能源草全基因组范围的表观基因组图谱,并系统注释了255629个能源草非编码功能元件,标注了基因表达的‘开关’。”福建农林大学国家菌草工程技术研究中心首席科学家林占熺说。 据了解,福建农林大学国家菌草工程技术研究中心紧密跟踪全球生物质能源发展趋势,长期致力于能源草研究与应用推广。林占熺说,能源草综合数据库的建设将进一步推动能源草在新能源领域的科研与应用,让其成为发展新能源经济的“幸福草”。同时,数据库为全球能源草研究提供了集成数据源和整合工具集,将助力可持续农业与可再生能源发展迈上新台阶。