《土耳其研究数据管理:认知与实践》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2017-06-10
  • 当前研究数据的大量增长已经突显出研究数据管理对科学的重要性。研究数据不仅具有成本效益,还具有可靠、可发现、可获取与可重用的特点。本研究调研了土耳其研究者的对研究数据管理的认知与实践。通过在线调查的方式,对土耳其25所高校的教师进行调研,共采集532人的数据。调查发现,尽管土耳其的研究者认识到数据管理的好处,愿意和特定群体分享他们的研究数据,并且已有很好的保存习惯,但他们表示,自身缺乏研究数据管理所需的专业技能和知识。此外,没有给研究者提供制度化的支持(人员、培训、软件和硬件)。一套结构良好的数据策略或政策应包括资源配置(认知、培训、软件/硬件),并由土耳其研究机构提供支持,这也是土耳其的研究者为了更好的数据管理实践而发出的诉求。

相关报告
  • 《 Frontiers推出FAIR2数据管理》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2025-04-30
    •     2025年开放数据日,Frontiers正式启动FAIR2(FAIR Squared?)数据管理试点项目,这是一种首创的同行评审服务,帮助研究人员因其工作获得认可和引用,同时使数据为AI做好准备、可重用且具有影响力。FAIR2数据管理利用AI辅助管理构建研究数据结构,使其更易于被人类和机器查找、重用和分析,从而使研究人员能够专注于数据发现而非数据准备。通过使数据集共享和优化以供重复使用,FAIR2数据管理提高了研究效率和可重复性,推动全球健康、可持续性和科学创新方面的突破。     由于大多数科学数据难以被发现、获取和重复使用,每年有数十亿美元的研究价值被浪费。碎片化的格式、缺失的细节和技术障碍阻碍了人类和AI驱动的分析。研究人员花费大量宝贵时间清理数据,而不是进行数据发现,他们很少因生成的数据而获得认可。与此同时,资助者越来越多地要求研究人员发布他们的数据,但他们缺乏合规的工具且未得到奖励。如果没有可扩展的解决方案,大量的知识将被锁定,阻碍科学进步。     Frontiers的FAIR2数据管理背后的Senscience公司联合创始人兼董事总经理Sean Hill博士表示,“长期以来,研究人员一直缺乏分享数据的工具和激励措施,导致大量有价值的研究丢失,而这些数据可以推动突破性进展,促进创新,并提高全球研究质量。我们的AI驱动的数据管家使数据策划更简单、更有意义,帮助像Frontiers这样的出版商为研究人员提供一种高效的方式来分享他们的数据,并确保数据保持可访问性和可重用性,并为未来的发现做好数据准备。”     FAIR2数据管理超越了FAIR原则,通过提供一个AI驱动的解决方案,将研究数据转化为结构化的、机器可操作的资源。由Senscience提供支持,它利用AI数据管家自动化数据组织,提高可用性并协助治理。研究人员可以从AI辅助工作流程中受益,该工作流程简化了数据准备和共享,将其数据集转化为FAIR2数据包、交互式探索门户以及在Frontiers期刊中经过同行评审的FAIR2数据文章,从而最大限度地提高可见性、认可度和引用率。     Frontiers的联合创始人兼首席执行官Kamila Markram博士强调,“我们面临的全球挑战需要由更好的数据驱动更好的科学。数据不仅仅是开放的,还必须经过良好组织、可重用且具有影响力。FAIR2数据管理将数据转化为发现的工具,应对全球健康、可持续性等方面的紧迫挑战。”     (1)什么是FAIR2?推进FAIR迈向为AI时代     多年来,FAIR原则一直是研究数据共享的基础。然而,随着机器学习和AI成为科学研究中越来越重要的工具,数据必须同时为人类和机器进行结构化。     FAIR2(FAIR Squared)通过定义一个正式规范来扩展FAIR原则,使研究数据可用于AI,与负责任的AI原则保持一致,并为深入科学重用进行结构化。它与MLCommons Croissant的AI-ready格式兼容,整合了科学严谨性、可重用性和互操作性的基本要素。FAIR2确保数据得到充分记录,并与来源、方法和详细的数据字典相关联,为每个数据集创建一个具有上下文的表示。它还与TensorFlow、JAX和PyTorch整合,支持AI驱动的分析,便于在Kaggle和Hugging Face上共享,从而增强其跨学科的影响力。     FAIR原则论文的作者、莱顿公平与科学研究所(LIFES)创始主任Barend Mons教授强调了结构化、良好治理数据的必要性,“开放科学必须从原则转向实施、结构和治理。FAIR2为AI-ready、具有上下文且负责任治理的数据提供了框架,确保了明智的重复使用。FAIR2数据管理将这一理念付诸实践,帮助研究人员创建一个完全AI-ready、机器可操作数据的可扩展生态系统。”     (2)AI辅助数据管理的实际应用     FAIR2数据管理的力量已经在实践中得到证明。第一篇经过同行评审的FAIR2数据文章和FAIR2数据门户展示了AI驱动的数据管理。该数据集由西班牙AZTI基金会的ángel Borja博士领导,涵盖了巴斯克地区近三十年的海洋生物多样性监测,由巴斯克水务局(URA)管理,通过FAIR2进行整理,将长期环境数据转化为AI-ready资源。 ángel Borja博士强调了AI驱动数据管理的影响,“AI辅助管理改变游戏规则。AI辅助元数据创建使海洋可持续性研究更易于获取,为科学家、管理者和决策者提供了更快、更准确的见解。”     FAIR2数据门户进一步扩展了这一功能,提供AI聊天、交互式数据探索、AI生成的播客以及与Python和Jupyter Notebook的整合,使研究人员能够以全新的方式进行数据交互和数据分析。     (3)加入FAIR2数据管理试点     Frontiers邀请研究人员加入FAIR2数据管理试点项目,这是一个免费展示数据集并获得AI辅助数据管理的机会,所有服务费用全免。     ·将研究数据转化为FAIR2数据包、交互式数据门户和经过同行评审的FAIR2数据文章。     ·使用针对机器学习和传统分析优化的AI-ready、可引用数据集提高可见性。     ·通过AI辅助FAIR2工作流程简化数据管理。
  • 《“数据下海”的海南实践》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:liguiju
    • 发布时间:2023-02-22
    • 近日,全球首个商用 UDC(海底数据中心)项目在海南省陵水黎族自治县开机运行,为解决该行业高耗能、高耗水等问题打开了新的突破口。该项目还将承担起验证相关商业模式的重任,为根植蔚蓝的数据中心带来无尽的产业发展空间。 创新示范 建设海底数据中心 近日,在海南省陵水黎族自治县英州镇清水湾靠海一带区域,工人们正在加紧建设海南海底数据中心项目(一期)岸站、海兰信海洋科技展厅和海兰云机房等岸站基地相关建筑物及设备,推进项目收尾工作。距离岸线几公里开外,一艘作业船只正在进行“海底数据舱”入海安装和维护。 海底数据中心由岸站、水下中继站、水下数据终端和海缆组成,岸站承载电力、网络接入、中央监控等设施,水下中继站是负责电力及网络分发、控制、回传的中间接续水下设施的统称,水下数据终端集中放置电子信息设备及运行支持环境的水下设施。其中,水下中继站和水下数据终端均部署在指定海底。 该项目的核心装备“海底数据舱”呈圆柱形罐体状,可实现舱内恒湿、恒压、无氧的安全密闭环境。应用水深超过30米,重量达1300吨,相当于1000辆小汽车的重量,罐体直径3.6米,与“天和号”空间站核心舱相当,是目前全球最大的“海底数据舱”,结构设计寿命为25年。 海底数据中心设计方案采用重力热管原理,利用海水作为自然冷源,总体能效较传统机房提升40%~60%。 此前,承建方深圳海兰云数据中心科技有限公司联合国家海洋环境监测中心,对海底数据中心建设海域进行全岛筛选,最终项目落户陵水。该处近岸海水温度低(<24.5℃),可满足海底数据中心对低温海水的建设需要。 陵水县自然资源和规划局局长苏军介绍,陵水 UDC项目的数据舱和配套装备将作为海南省自贸港数字化建设的创新示范工程,完成入海安装并适时开机。近期,项目第一个模块已完成水下安装。 苏军表示,陵水 UDC项目利用丰富的海洋资源,解决陆上数据中心能耗高、消耗淡水等问题,并可以与海洋可再生能源相结合。目前,该项目已被纳入海南省超常规稳住经济大盘行动方案、海南省海洋经济发展“十四五”规划,同时列入海南省2022年重点(重大)项目预备项目。 据项目方技术人员介绍,陵水 UDC项目计划分三期完成:第一期(2022~2023年)为示范开发工程项目,前期计划布放3个海底数据中心模块,共6个舱体,总投资两亿元;第二期(2023~2024年)为规模化开发项目,将完成30个舱的建设,预计总投资规模将达到12亿元;第三期(2025年开始)为商业化推广开发项目,将完成100个舱的建设,预计投资规模达到约56亿元。 “陆数海算” 商业模式提质扩容 作为数字经济底座的数据中心产业,将进入新一轮爆发期。与前几年快速发展不同的是,互联网数据中心产业高耗能、高耗水等资源消耗特性已受到社会关注,各地政府近年来纷纷出台了相应的限制政策措施。 海南省海洋经济发展“十四五”规划提出建设海南海底数据中心,一期布放100个数据舱,并逐步建设以海底数据中心为核心的综合性海洋新技术产业园。陵水 UDC项目正好响应了这一政策要求。目前陵水项目一期客户已经确定,分别代表了电信运营商、人工智能、第三方 IDC运营商3个不同应用场景。二期将重点开拓头部互联网和超算客户。长期来看,海南自贸港封关运作后,将迎来大量的离岸数据中心需求。 “双方合作实现了优势互补、强强合作。”作为陵水 UDC项目首批客户之一,中国电信海南公司总经理李云庄表示,根据中国电信和深圳海兰云数据中心科技有限公司签订的项目合作协议,落户陵水的首个“海底数据舱”将用于部署中国电信天翼云海南海底媒体存储节点、内容分发网络节点及海南省国资专属云资源池,打造专属海底数据中心的天翼云平台。 海底数据中心的商业模式也正在陆续扩容并进行验证。海兰信董事长申万秋说,除现有的托管服务以外,接下来会迅速推出服务器租赁、海底云空间、云算力租赁等商业模式,届时海底数据中心的运维方式将不是客户所担忧的问题,将是对客户更友好的模式。 “海底数据中心是陆地数据中心的补充而不是替代,主要定位于低耗能数据中心的细分赛道,在特定地域和场景发挥其独特价值,具有高行业壁垒的特征,对于海外市场、互联网巨头,也可采用灵活的合作模式。”申万秋说,目前项目主要的成本劣势体现在海底单舱布放的用船成本,未来大规模部署和运维过程中,单舱建造和维护成本将因规模效应而大大降低。 中国工程院院士邬贺铨说,当前数据中心发展面临比较大的挑战,机柜密度不断增加,给机柜的热量管理、电源分配、安装迁移等方面带来巨大难题,“液冷”趋势明显,自然冷却及免费制冷趋势明显。 邬贺铨认为,海底数据中心这种“自然免费的不间断冷源、无压缩机/冷却塔制冷”的优势,能解决现存的很多成本问题。同时,海底数据中心在灾备场景下有着独特的价值,特别在防火、防洪和防台风方面。 绿色升级 助力“双碳”目标实现 作为新基建的数据中心在为人类社会提供便捷服务的同时,也在消耗着巨大的能源和资源。根据《中国数据中心能源使用报告》,2018年中国数据中心用电量约613亿度,2019年全国数据中心行业实际发生的年总用电量也约为600亿度。 申万秋介绍,海底数据中心的主要优势体现在低耗能、省资源、省资金投入;可在沿海发达城市海岸部署,实现低延时;舱内惰性气体的密闭环境,提高 IT设备的安全性和可靠性。此外,海底数据中心建设基本没有土建,可模块化部署,不存在机架空置情况,与海上绿色能源实现多能互补。 中国工程院院士倪光南认为,海底数据中心对海洋的使用不是排他性的,布放的海域既可以包容海洋牧场、渔业网箱等生态类项目,又可以与海上风电、海上石油平台等工业类项目互相服务,是陆海统筹、生态用海、集约用海的实践探索。同时,相比于陆上数据中心,海底数据中心的建设和运行省电、省地、省水、绿色,总成本具有明显优势。 2021年底以来,国家发展改革委、工信部等部门先后出台了《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》《“十四五”工业绿色发展规划》等文件,鼓励探索利用河湖、海洋等优势资源,建设利用自然冷源散热的数据中心,充分发挥气候水文和地形地貌等自然条件天然优势,因地制宜促进数据中心节能降耗。 海南、广东、山东等地制定的海洋经济发展“十四五”规划,均提出要促进海底数据中心研发及建设。 邬贺铨表示,海南作为自由贸易港,数据开放需要安全有序流动,数据中心作为经济底座,支撑作用明显。海底数据中心充分利用海洋可再生能源,把海洋能源转化为海洋算力,在能耗和能源方面双管齐下,为国家“双碳”目标献计献策。“这种硬核科技的创新和引领,值得鼓励和支持。” “海洋经济数字化转型潜力巨大。”中国工程院院士蒋兴伟认为,在国家建设“一带一路”、建设海洋强国的时代背景下,作为海洋经济的“大脑”,海洋大数据以新基建和海洋科技创新作为驱动力,牢牢把握海洋经济转型升级的主线,是高质量发展的重要内容,对管理决策具有重要支撑作用。 苏军说,陵水 UDC项目的建设,将为我国实现“双碳”目标提供新方案,为陆海统筹及立体用海提供新思路,为“东数西算”战略提供“陆数海算”新补充,为“海洋经济+数字经济”的发展创建新赛道,为我国建设国际数据港和生态文明试验区提供了创新方案,为我国绿色低碳发展作出新贡献。