《加强数据管理中研究方法的元数据》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2018-11-22
  • 元数据是使数据集更易于其他人访问以及促进有意义的解释和使用的重要组成部分。特别是,数据用户期望获得关于生成数据的方法或过程的信息,以供审查和数据质量评估。本研究重点关注如何通过研究科研数据的元数据方案来支持方法的描述。对这些方案的分析表明,在方法描述方面存在不同程度的支持和指导,但有可能在将数据编制成文件的生产过程方面提供更全面的要素,以便加以综合和采用。此项初步调查的结论是,下一步将更好地理解研究数据的元数据需求,以及对长期数据共享和重用的管理支持。

相关报告
  • 《科学数据管理中的数据选择与评价关键要素研究》

    • 来源专题:图书情报
    • 编译者:xuxue
    • 发布时间:2018-04-10
    • [目的/意义] 为了优化数据资源质量,提高数据管理效率;降低数据管理成本和管理风险,杜绝造假数据的流入,数据收藏和服务机构需要对数据进行选择与评价,进而收集和保留具有长期保存价值的数据集,剔除没有保存价值的数据集。[方法/过程] 文章对数据选择与评价的关键构成要素如选择与评价政策、主体职能定位、评价标准和评价决策过程进行了分析研究。[结果/结论] 数据选择及评价是数据管理中的一项重要工作,必须厘清相关利益主体的职能定位、建立完善的数据选择与评价政策、评价标准,做出科学的评价决策,才能做好数据选择和评价工作。
  • 《 Frontiers推出FAIR2数据管理》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2025-04-30
    •     2025年开放数据日,Frontiers正式启动FAIR2(FAIR Squared?)数据管理试点项目,这是一种首创的同行评审服务,帮助研究人员因其工作获得认可和引用,同时使数据为AI做好准备、可重用且具有影响力。FAIR2数据管理利用AI辅助管理构建研究数据结构,使其更易于被人类和机器查找、重用和分析,从而使研究人员能够专注于数据发现而非数据准备。通过使数据集共享和优化以供重复使用,FAIR2数据管理提高了研究效率和可重复性,推动全球健康、可持续性和科学创新方面的突破。     由于大多数科学数据难以被发现、获取和重复使用,每年有数十亿美元的研究价值被浪费。碎片化的格式、缺失的细节和技术障碍阻碍了人类和AI驱动的分析。研究人员花费大量宝贵时间清理数据,而不是进行数据发现,他们很少因生成的数据而获得认可。与此同时,资助者越来越多地要求研究人员发布他们的数据,但他们缺乏合规的工具且未得到奖励。如果没有可扩展的解决方案,大量的知识将被锁定,阻碍科学进步。     Frontiers的FAIR2数据管理背后的Senscience公司联合创始人兼董事总经理Sean Hill博士表示,“长期以来,研究人员一直缺乏分享数据的工具和激励措施,导致大量有价值的研究丢失,而这些数据可以推动突破性进展,促进创新,并提高全球研究质量。我们的AI驱动的数据管家使数据策划更简单、更有意义,帮助像Frontiers这样的出版商为研究人员提供一种高效的方式来分享他们的数据,并确保数据保持可访问性和可重用性,并为未来的发现做好数据准备。”     FAIR2数据管理超越了FAIR原则,通过提供一个AI驱动的解决方案,将研究数据转化为结构化的、机器可操作的资源。由Senscience提供支持,它利用AI数据管家自动化数据组织,提高可用性并协助治理。研究人员可以从AI辅助工作流程中受益,该工作流程简化了数据准备和共享,将其数据集转化为FAIR2数据包、交互式探索门户以及在Frontiers期刊中经过同行评审的FAIR2数据文章,从而最大限度地提高可见性、认可度和引用率。     Frontiers的联合创始人兼首席执行官Kamila Markram博士强调,“我们面临的全球挑战需要由更好的数据驱动更好的科学。数据不仅仅是开放的,还必须经过良好组织、可重用且具有影响力。FAIR2数据管理将数据转化为发现的工具,应对全球健康、可持续性等方面的紧迫挑战。”     (1)什么是FAIR2?推进FAIR迈向为AI时代     多年来,FAIR原则一直是研究数据共享的基础。然而,随着机器学习和AI成为科学研究中越来越重要的工具,数据必须同时为人类和机器进行结构化。     FAIR2(FAIR Squared)通过定义一个正式规范来扩展FAIR原则,使研究数据可用于AI,与负责任的AI原则保持一致,并为深入科学重用进行结构化。它与MLCommons Croissant的AI-ready格式兼容,整合了科学严谨性、可重用性和互操作性的基本要素。FAIR2确保数据得到充分记录,并与来源、方法和详细的数据字典相关联,为每个数据集创建一个具有上下文的表示。它还与TensorFlow、JAX和PyTorch整合,支持AI驱动的分析,便于在Kaggle和Hugging Face上共享,从而增强其跨学科的影响力。     FAIR原则论文的作者、莱顿公平与科学研究所(LIFES)创始主任Barend Mons教授强调了结构化、良好治理数据的必要性,“开放科学必须从原则转向实施、结构和治理。FAIR2为AI-ready、具有上下文且负责任治理的数据提供了框架,确保了明智的重复使用。FAIR2数据管理将这一理念付诸实践,帮助研究人员创建一个完全AI-ready、机器可操作数据的可扩展生态系统。”     (2)AI辅助数据管理的实际应用     FAIR2数据管理的力量已经在实践中得到证明。第一篇经过同行评审的FAIR2数据文章和FAIR2数据门户展示了AI驱动的数据管理。该数据集由西班牙AZTI基金会的ángel Borja博士领导,涵盖了巴斯克地区近三十年的海洋生物多样性监测,由巴斯克水务局(URA)管理,通过FAIR2进行整理,将长期环境数据转化为AI-ready资源。 ángel Borja博士强调了AI驱动数据管理的影响,“AI辅助管理改变游戏规则。AI辅助元数据创建使海洋可持续性研究更易于获取,为科学家、管理者和决策者提供了更快、更准确的见解。”     FAIR2数据门户进一步扩展了这一功能,提供AI聊天、交互式数据探索、AI生成的播客以及与Python和Jupyter Notebook的整合,使研究人员能够以全新的方式进行数据交互和数据分析。     (3)加入FAIR2数据管理试点     Frontiers邀请研究人员加入FAIR2数据管理试点项目,这是一个免费展示数据集并获得AI辅助数据管理的机会,所有服务费用全免。     ·将研究数据转化为FAIR2数据包、交互式数据门户和经过同行评审的FAIR2数据文章。     ·使用针对机器学习和传统分析优化的AI-ready、可引用数据集提高可见性。     ·通过AI辅助FAIR2工作流程简化数据管理。