《关联缺失:期刊关联数据的演变现状》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2019-01-13
  • 关联数据有可能在开放的网络上公开有关序列和序列关系的描述性元数据,并允许有关序列化的图书馆信息与看似无限的网络数据元素之间建立创造性的连接。关联数据也有可能解决一些经典的串行困境,包括最新记录与连续记录的比较,以及印刷版和在线版的单记录与多记录的比较。这些可能性如何与商业和图书馆部门中不断发展的关联数据项目的发展现状以及国会图书馆的书目框架倡议(BIBFRAME)相适应?本文的三个部分将介绍关于关联数据和序列化的不同观点。

相关报告
  • 《学术元数据现状:2023》

    • 来源专题:科技期刊发展智库
    • 编译者:李涵霄
    • 发布时间:2023-07-14
    •   随着学术交流迅速适应开放科学、技术和文化的巨大变化,元数据和持久性标识符(PIDs)重新受到关注,这些标识符是关于人、地方和对象的必要组成部分,是行业活力的重要组成部分。仅在美国政策层面,利用元数据加速行业转型是尼尔森备忘录和最近来自NIH和交通部的信息请求的共同主题。   学术研究是复杂且相互关联的,一个领域的变化可能会引发整个生态系统的改善或恶化。举例来说,考虑PIDs在开放获取(OA)资金拨款方面的作用。OA 管理平台依赖于元数据元素,特别是来自上游提交和同行评审系统的组织 PIDs,来自动匹配稿件与潜在资金来源。这通常发生在文章接受时,并且越来越多地发生在提交时,消除了对作者的手动管理,并支持出版商、机构、联盟和资助者大规模实现OA。   为了对组织ID进行健康检查,我们在2021年审查了我们的科学传播OA工作流平台RightsLink中跨出版商的机构从属和/或资助者数据记录。我们发现,82%的已接受稿件包含了这些数据,这比前几年有所改善。然而,这些统计数据掩盖了一个丑陋的事实:在许多情况下,这些稿件使用机构电子邮件域名作为资助或折扣资格的代理而不是使用PID。在没有PID的18%的稿件中,错过的资助机会会给作者、机构和出版商带来不必要的工作(和费用),以便事后进行调和。   即使美国版权结算中心(Copyright Clearance Center,CCC)——无论是单独还是与其合作伙伴和出版商合作——能够在稿件接受时关闭这些元数据差距,这也是后期的过程,而PIDs在研究生命周期早期的优势将会丧失。在上游记录系统中解决元数据差距会更有效,这样就不会颠倒大局。这正是我们鼓励NIH将资助申请过程视为早期机会来强制实施PIDs并向支撑研究生命周期的其他系统(例如,当前研究信息系统)进行级联的原因。   但是从哪里开始呢?PID是一个不稳定的话题,我们需要与那些对ISNI和Ringgold的复杂性不感兴趣的人进行沟通。但如果这些人知道缺乏PID会导致缺乏资金,他们就会关心。为了解决这个问题,我们最近与数十个利益相关者进行了交谈,并通过OA映射了一系列元数据挑战。我们建立在现有工作的基础上,以可视化分散的元数据供应链的连锁反应。结果是一个研究生命周期的交互式报告,旨在让每个人更深入地了解2023年学术元数据的状态。尽管问题很多,但它们并非不可克服,而且存在许多支持变革的基础设施。   我们与Media Growth Strategies合作,采访了来自机构、出版商、资助者、研究人员、服务提供商、PID提供商和行业协会的代表,以了解整个生态系统中元数据和PID的现状(见图1)。我们问了以下问题: ●谁应该创建和维护元数据?它应该起源于哪里? ●您投入了哪些资源来创建、管理或维护各种类型的元数据? ●当涉及到元数据管理和/或使用PID时,您面临的最大挑战是什么? ●最关键的元数据元素是什么? ●如果这些元素不能在学术交流中持续存在,那又会有什么危险呢? ●谁应该拥有元数据的质量和控制?   以下是有关元数据断链和复杂性在研究生命周期中造成影响的相关人士的观点:   研究人员:各方利益相关者普遍认为,研究人员承担着重要的行政负担,以断言或重新断言数据(例如机构隶属、资助者ID),最终干扰和延迟科学发现。   机构:由于研究生命周期中的元数据不一致性,机构需要采用耗费人力的解决方法手动调解资助资格和APC账单,并将非结构化的数据标准化,以进行综合分析。   资助者:缺失元数据(例如注册的授予DOI、机构隶属)使资助机构难以链接资助和研究成果,可能导致开放获取的采用率低、问题性的影响跟踪以及不完整的分析,进而影响资助决策。   出版商:元数据断链干扰业务转型计划,导致高昂的运营和机会成本,并使履行开放获取协议条款和分析交易绩效以便为未来决策提供参考更加复杂。   许多利益相关者认识到,新的元数据策略、包容性政策和一个强大的互操作系统框架对于现代化学术交流的这一要素至关重要。同时,整个生态系统致力于提高所有团体的数据质量将有助于推动向开放的转变,同时有助于保护研究诚信、扩大可发现性和改善影响度量。如果整个行业共同努力通过重新审视元数据政策和实践来缩小这些差距,利益相关者无疑将感受到更少的痛苦。
  • 《开放标本运动建议或将改变现代科学》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2021-03-08
    • 动物源性冠状病毒引起了例如SARS、MERS以及当前的新冠肺炎等新发传染病(Emerging Infectious Disease,EID)的暴发,在寻找引起新冠肺炎疫情的病毒SARS-CoV-2宿主的过程中,天然宿主的研究对象曾指向蝙蝠和穿山甲,但病毒的中间宿主目前尚不明晰。迄今为止,对于动物、动物产品等相关的病原体筛查并没有相关国际惯例,并且在多数时候研究人员对EID诊断的能力也相对有限。基于此,国际实地项目(Field Projects International,FPI)野生动物疾病监测重点研究小组研究人员M. Watsa等2020年7月10日在《科学》发文表示,与野生动物贸易相关的EID风险仍是当前疾病监测工作中尚未解决的最大挑战,同时提出了防范人畜共患EID需进行“严格的野生动物疾病监测”的观点 。2020年11月13日,美国堪萨斯大学生物多样性研究所研究员、堪萨斯大学自然历史博物馆哺乳动物助理馆长Jocelyn Colella在《科学》发文 ,对M. Watsa等提出的“严格的野生动物疾病监测”观点表示部分赞同,M. Wasta等强调了“全健康(One Health)”的方法在促进整合目前孤立的人畜共患疾病研究等方面的重要价值,然而,大多数导致人类严重疾病暴发的病原体都是动物源性的,在了解其野生宿主进化以及相关公共卫生领域,国际社会对自然历史博物馆冷冻脊椎动物组织收藏发展的支持仍是“全健康”中缺失的一个关键组成部分;同时Jocelyn Colella指出,博物馆生物库可作为公共卫生研究的重要参与者,以帮助满足分析、监测和减轻EID的迫切需要。在自然历史博物馆发展方面,考虑到生物标本作为主要科学数据的重要性,12月16日,Jocelyn Colella在《生物科学》发文,进一步针对标本保藏等问题,提出了开放标本运动(Open-Specimen Movement)建议 ,旨在将开放科学精神(即通过强调增加透明度、可重复性以及数据共享来改变现代科学)应用于自然历史博物馆标本的存放、管理等方面。 为了对公共博物馆中的标本和相关数据进行更好的保存,Jocelyn Colella提出的开放标本运动建议鼓励科学期刊和出版商扩大开放数据倡议,同时通过资助机构和许可机构将标本保藏实践纳入数据管理计划(Data management plans,DMPs)等来提高标本存放的要求。 1. 期刊和出版商对开放标本的要求 越来越多的期刊和出版商采用开放数据政策,要求作者保存并上传相关数据以增加文章数据的透明度、开放性以及重现性。但其对数据方面的要求(尤其对特定数据类型的要求)来说,各期刊间差异较大。总的来看目前最少关注的是标本问题(动物学和生态学的期刊体现较为明显),比如大多数提到标本的只要求对新物种进行描述即可,并未对其保藏做相关规定,这也容易导致部分相关数据来源(比如测量值等)与期刊要求的保留原始数据之间的矛盾,而这一问题是对整个生物界敲出的警钟,警示研究人员需重点关注原始标本数据的保存。另一方面,除动物学和生态学类期刊外,更多的期刊应加入到对物理材料永久保藏进行要求的队伍中来,在跨期刊开放数据要求不一致的问题上,需鼓励编辑和审稿人对作者提出标本保藏的要求,这对于促进规范标本保藏的生命科学文化变革至关重要。 2. 资助和许可机构对标本存放的要求 在过去十年中,许多美国联邦机构已经有意识地转向开放数据框架,并通过法律要求和建议以及相关行动来提高数据透明度和安全性。尽管如此,现有的开放数据的要求高度可变且特定于某些机构,并且很少将标本作为主要数据来使用。但事实上,在促进科学发展、确保国家数据利益并为科学基础设施做出贡献方面,标本的存放与这些机构的使命密切相关。目前,基于馆藏的研究机构在其馆藏管理指南和许可申请中,都提到了通过对标本的永久保藏确保发布数据以标准化和开放形式进行呈现。但需要注意的一点是,鉴于标本对于科学的可重复性和扩展性的重要作用,就以前标本收藏许可申请中提到的“不再具有美国地质调查局(US Geological Survey,USGS)认定的科学价值或潜在用途,则可以对其进行销毁”的说法应进行相关更改,对某些保藏品确定为没有价值就对其销毁的做法也是不合理的。总之,将标本管理明确纳入提议的DMPs、许可证申请和强制性年度报告将有助于缩小现有差距,并创建更加统一的标本存放文化。 3. 将标本整合到DMPs中 DMPs描述了在项目过程中要收集、存储和共享的数据类型,以确保长期的数据使用、重用和延用。鉴于标本保藏的价值,除了通常被认为是DMPs一部分衍生数据资源的计划之外,制定明确的标本存放、可访问性计划等是至关重要的。标本管理的最佳实践适用于标本或数据生命周期的所有阶段,包括规划(Planning)、获取(Acquisition)、使用(Use)、保存(Preservation)和传播(Publication and sharing),这一过程凸显了标本馆藏在数据安全中的关键作用。在设计全面的、具有标本意识的DMPs时有几个考虑因素是确保广泛保存和获取材料所必需的,而博物馆馆藏在促进这一过程中具有核心作用。 (1)规划 DMPs提供了有关要收集物种及样品的基本信息,以及最终授权获取生物或样品的相关许可信息。DMPs应清楚的确定许可机构,并指定要收集并最终保藏的标本数量及分类学身份。另一方面,为了缓解研究人员对正在进行的项目中竞争的恐惧,相关标本可以由项目研究人员暂存,但DMPs需明确双方商定的保藏范围和时长,因此DMPs还应包括研究人员计划。事实上,与项目研究人员相比,博物馆拥有更好的长期对数据安全性使用和管理等方面的能力,标本所有权转移到博物馆中可以确保这些资源及其相关数据有更高的价值或使用寿命,从而最大限度的提高了这些资源未来的可重用性。 (2)获取 野外采集、标本制备等的最佳实践在各分类群中已经确立,这对于确保高质量保藏和最大限度提高可重用性至关重要。DMPs应包括对一系列数据格式和内容(例如记录标本的体重、性别、采集环境、采集日期、采集方法、采集人等)的相关标准准备计划,以便通过研究工作流程,简化对生物样本或相关样本的跟踪并扩展其使用范围。 (3)使用 DMPs应包括对派生数据的描述,且最好以有助于在尚未预料到的或长期的项目中重复使用的方式处理原始标本数据,同时还应确保在整个样本和研究工作流程中保持适当的记录以提高可重用性和样本实用性,并将其集成到博物馆的样本跟踪数据库中。 (4)保存 数据管理的最佳实践包括将多个数据副本存放在不同地方以降低与单副本数据相关的风险。与长期标本的整理、存储和维护相关的成本可能很高,因此通常是DMPs和提案预算的重要组成部分。收集人员和已识别的生物存储库必须事先就拟议的标本保存费用达成共识,以避免不必要的财务压力和标本临时纳入博物馆而带来后续的挑战。对于多年期项目,DMPs还应指定保存间隔,促进在标本采集和使用后快速、定期地将标本整合到公共研究馆藏中,以确保尽可能高的数据准确性和安全性。 (5)传播 DMPs应以开放的、机器可读的格式维护详细的标本信息,该格式既可以数字方式访问,又可以与最终出版物相关联,以最大程度地提高相关数据的可访问性和数据集成性。数字化的相关举措(如iDigBio)正在增加标本数据的数字连接性,而这将进一步促进综合科学观点,防止不必要的重复,最大化收集材料的科学潜力,并增加对全球研究人员有用的不断增长的生物信息系统。 4. 结论 时间久远和地理范围广泛的生物样本收集的累积价值不仅在于通过单一调查获得的即时见解,还在于随着技术的发展、访问范围的扩大以及数据流的增强而使标本相关数据大量预期外的未来用途变得关联性越来越高。作为标本保存和管理的关键基础设施,自然历史博物馆的记录使标本的普遍保存、可用性、安全性和未来的广泛使用成为可能,体现了开放科学伦理(open-science ethic)。在博物馆内建立标本基础设施是扩展标本网络的基础,从而可以公开地管理、使用和共享原始的生物多样性记录。在最近一些美国联邦机构资助的野生动物采样计划中严重忽视了标本保藏的重要性,如美国国家科学基金会(National Science Foundation,NSF)资助的国家生态监测网(the National Ecological Observatory Network,NEON)等,在一定程度上给更广泛的科学界带来了损失。诸如此类的大规模野生动植物采样计划缺乏标本档案,阻碍了科学重现、推广以及研究人员对宿主标识、分布、性状和病原体关联的生物分类验证。将标本纳入现有的DMPs和年度报告要求并增加期刊的开放数据要求,将确保科学的可重复性,并有利于防止国家和全球生物多样性不可替代的记录丢失。而这可以通过编辑审核主要科学文献、批准和许可申请的推荐人以及年度报告来实现,随着时间的推移,这些措施可以转变目前现状并使其趋于正常化。在全球快速变化和生物多样性丧失的时期,这种新的转变将确保野外采集标本的持续利用,并促进基于标本的科学透明度和可重复性。 宋琪 编译自https://academic.oup.com/bioscience/advance- article/doi/10.1093/biosci/biaa146/6030117?login=true 原文标题:The Open-Specimen Movement