《中国科学院科学数据中心建设与服务体系》

  • 来源专题:国家病毒资源信息监测和情报服务平台
  • 编译者: mall
  • 发布时间:2021-03-22
  • 数据资源作为重要的战略资源是驱动各领域创新发展的重要因素。随着信息化进程的发展,分布式多源异构数据的管理和应用问题凸显,如何有效地实现分布式数据的管理、整合、服务成为推动科研与应用的共性需求和必要手段。
    中国科学院计算机网络信息中心大数据技术与应用发展部(以下简称大数据部)自“十•五”开始承担中国科学院“科学数据库及其应用系统”建设工作以来,立足实际需求,面向应用实效,扎实推进标准与系统研制和推广应用工作。从“十•五”面向分布式异构数据资源的规范化统一服务,到“十一•五”数据资源及其应用环境(含国家科学数据共享工程项目“基础科学数据共享网”)建设和服务体系形成,再到“十二•五”响应“海-云”环境和“十三•五”适应大数据环境下科研模式变革的体系完善,大数据部与时俱进推动科学数据中心体系相关标准(55项)、技术、工具(13个)的研制和应用,是我国数据资源管理研究与实践的先锋,为数据资源的开放与共享提供了强劲的源动力。
    当前随着国家《科学数据管理办法》和首批国家科学数据中心的发布,结合国家建设科学数据中心的战略需求,大数据部提出面向科学数据数据中心体系的全生命周期体系化数据资源管理与服务解决方案。
    标准规范体系
    科学数据标准体系基本实现了从数据资源建设到应用及效果评估全生命周期关键内容的规范化,在科学数据资源建设和应用服务中发挥了积极的助推作用。科学数据标准体系可分为指导规范、数据采集与整理、元数据与元模型、系统与接口、数据管理、数据服务等类型,主要内容详见表1。自“十一•五”项目结束以来,在线发布的标准建设成果已被访问下载超过17万次之多,配套工具软件已经在项目内全面推广使用,部分成果(如VDB、MSIS等)还广泛应用到项目之外。
    经过十余年的努力,大数据部的标准工作已经逐步形成了“有需求,多合作,要实用,慎提升”的特点,工作中与院内外合作机构建立了良好的关系,并谨慎的将有应用前景的标准提升为国家标准、国际标准,先后作为第一责任单位完成了《生态科学数据元数据(GB/T20533-2006)》、《信息技术数据溯源描述模型(GB/T34945-2017)》、《信息技术科学数据引用(GB/T35294-2017)》和CODATA国际标准《天然气水合物描述语言(GasHydrate Markup Language)》、以第二责任单位完成了《检测资源信息共享体系建设指南(GB/Z27414-2012)》和《土壤科学数据元数据(GB/T32739-2016)》。详见表2。
    工具与技术体系
    面向科学数据中心体系化、系统化建设及管理的需求,大数据部研发重点包括分布式数据资源自主管理与服务,数据资源集成整合管理与服务,数据资源与服务监控、统计分析及评估管理,数据资源统一发布、共享、服务及应用等。同时面向不同类型数据提供数据资源管理,并提供统一的管理和外延服务。

    优势总结如下:
    1、体系化的解决方案。采用体系化的设计理念,提供自顶向下的总体设计,协同策略、系统、规则、设施等各方面,保障数据资源高效、安全、可靠、敏捷的管理与服务。
    2、完备的服务平台和软件体系。提供包括集成化数据服务、数据资源的监控与管理、数据资源的整合、分布式数据资源的自主管理在内的数据资源管理、整合与服务平台及完备的软件体系,并可为个性化需求提供定制和支持。
    3、统一的管理和外延服务。基于标准化的数据资源管理机制,提供一整套有效的管理办法,并提供包括数据库建设、系统运维、服务咨询在内的多项外延服务。
    4、丰富的建设经验。30年来,为中国科学院各科研单位的数据资源建设与服务有效助力,在地理、生态、环境等领域深入探索,为60多家科研单位提供服务。重点负责了国家生态系统研究网络体系建设、国防资源服务体系建设,为相关领域科研信息化建设,提供了体系架构、系统设计、开发、服务一体化的建设方案。

  • 原文来源:https://www.escience.org.cn/normalization/article?id=2d13b0fea3dcfc432caaee99678d6bc3&code=2
相关报告
  • 《中国科学院植物科学数据中心正式获批》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2020-11-16
    • 中国科学院植物科学数据中心正式获批 2020年9月,中国科学院办公厅正式印发《关于发布中国科学院科学数据中心体系第二批科学数据中心名单的通知》,共有7个学科中心入选。其中,依托中国科学院植物所建设,昆明植物所等6家单位共同参与的中国科学院植物科学数据中心位列其中。 中国科学院植物科学数据中心将按照院办公厅和网络中心的要求,实现院内植物物种、植物生态和迁地保育等数据的深度整合,搭建面向全社会的数据智能查询、数据共享与远程服务网络平台,建立集存储、整合与挖掘分析于一体的植物科学数据中心,极大提升我国植物科学领域创新能力,支撑物种多样性和生态系统研究及植被重构,服务生态文明和美丽中国建设。依据《中国科学院科学数据管理与开放共享办法(试行)》,中国科学院数据中心体系由总中心、学科中心、所级中心三类组成。植物所科学数据中心已于2020年1月份成功获批院优秀所级数据中心。 (信息来源:http://www.ib.cas.cn/2019gb/News2019/202009/t20200916_5698505.html)
  • 《中国科学院海洋研究所数据中心》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:mall
    • 发布时间:2017-03-15
    • 中国科学院海洋研究所数据中心是隶属于所级公共技术服务与管理中心的技术支撑部门,主要负责海洋科学数据的收集、存储和管理,以及海洋科学数据资源服务平台和硬件存储系统的运维。数据资源主要包括海洋先导专项、近海观测研究网络黄东海站、海洋开放共享调查航次的原始数据和分析处理数据,以及海洋所已有的海洋科学研究数据。同时,数据中心还管理运行近海观测网络黄东海站陆基站,负责观测数据的接收、处理和数据产品的研发。 数据中心存储系统采用高端海量存储系统,可实现NAS和SAN并存的功能。全冗余控制器的设计,能够最大程度的实现数据的安全性和系统的稳定性,保证数据安全,同时可以动态调整应用的带宽、IO等性能,平衡存储资源占有率,实现负载均衡和资源优化。同时具有良好的扩展性,最大可支持32PB的存储空间,能够满足持续增加的海洋科学数据存储管理的需求。 通过数据中心统筹规划和整体运维,将推动海洋所数据资源的整合与应用,建设研究所完整数据资源链的共享数据库;通过建立科学数据汇交制度和组织管理制度,形成贯穿科研活动过程、覆盖主要科学活动的科学数据工作机制,实现数据归档和数据共享保障;通过建设海洋特色的数据资源体系和应用平台,为研究所科技创新奠定重要的数据资源支撑和持续发展基础。 网站链接: http://msdc.qdio.ac.cn/index.php?s=/articles/55.html