第一部分:研究背景
由于联邦政府政策的强制要求(由公众资助的研究成果必须对公众公开可访问),所以受资助的研究人员开始考虑如何将他们的研究数据共享,机构开始探索如何支持研究人员的工作。
推动研究数据共享的驱动力量包括:期刊和出版商数据可用性政策的不断增加,机构内部研究数据政策的增加,以及科学界对研究数据共享的认知提高。
研究数据共享的要求在未来将会持续增加,因为美国几乎所有的联邦资助机构都会根据OSTP(科学技术政策办公室)2022年发布的“确保联邦资助研究的免费、即时和平等获取”的要求,实施自己的公共获取或者数据共享政策。这一扩展将影响到所有拥有外部R&D(研究与开发)预算的联邦机构,以及被这些机构资助的院校和研究人员。
虽然主要由获得资助的研究人员负责其研究数据的管理,但最终还是由所在机构负责遵守资助协议和合同的相关条件。因此,院校通常会提供基础设施,以满足资助方对DMS(数据管理和共享)的要求,也同样满足来自学术出版商或其他利益相关方的DMS要求。为了实现这些支持机制,院校需要在数据共享基础设施的开发和维护上进行大量投资。此外,由于没有一个单独的机构部门或小组对研究数据支持服务负全责,因此对这些服务进行全面评估和协调显得至关重要。
对支持研究数据管理和共享的院校基础设施进行盘点是评估研究人员收到支持情况的有效方法。如果不进行盘点,院校领导可能无法知道哪些地方存在缺口或重叠,从而无法确定需要战略性投资的领域。此外,了解院校的资助研究人员如何公开其数据,以及他们是否利用了院校内部或外部提供的服务,对于院校来说也很有帮助。通过这些信息,院校可以进一步在数据共享基础设施上做出明智且有效的投资。
综上所示,完成对研究数据服务和研究人员数据共享活动的机构基础设施盘点,是了解院校研究数据管理和共享工作的重要一步。在ARL(研究型图书馆协会)的RADS(学术数据共享现实)计划里,就把这一盘点过程作为优先事项。RADS计划的第一阶段由美国国家科学基金会(NSF #2135874)资助,有六所院校参与,分别是康奈尔大学、杜克大学、密歇根大学、明尼苏达大学、弗吉尼亚理工大学和圣路易斯华盛顿大学。此报告提供了上述六所院校的数据管理和共享服务调查结果,并重点指出了资助研究人员的需求与院校提供的服务之间可能存在的错位。
第二部分:研究型图书馆开展的活动
图1. 六所RADS院校中图书馆支持的数据管理和共享活动
从图书馆的可视化图表中,可以得知,图书馆在整个研究生命周期的各个阶段以某种形式支持数据共享活动。作为学术机构的关键合作伙伴,图书馆可能会提供有关数据共享的二十多项服务,包括:
? 就数据使用协议提供咨询
? 支持知识产权问题
? 处理版权考虑、管理活跃数据
? 提供数据策展和保存服务
? 通过技术基础设施(如机构库)广泛提供数据(或就替代存储库提供咨询)。
相比之下,图书馆在研究生命周期的“结项和合规”阶段提供的支持最少,尽管如此,调查的六所院校中有一所(明尼苏达大学)表示在这一领域也提供了支持。
第三部分:研究型图书馆的机遇
研究结果显示,研究型图书馆和信息技术办公室在数据共享活动的服务、基础设施和人员支持方面提供了最广泛的支持。COGR在2023年5月的一项报告也发现,校园图书馆和信息技术办公室在行政层面提供了最大份额的机构支持。
然而,受访的研究人员表示在数据共享的众多活动中没有依赖于内部或外部支持。在26项活动中,有20项活动,70%或更多的研究人员报告称他们是靠自己或在研究小组内进行这些活动的。尽管研究人员和管理员所涉及的活动几乎相同,但每个群体可能对这些活动有不同的理解。
研究数据输出因研究项目的不同而不同,有些活动(例如,创建与数据或研究输出相关的文档以及决定共享哪些数据)更适合由研究人员自己或在他们的研究实验室中进行。所以尽管研究型图书馆内存在提供高层次指导的服务,但最终还是由研究人员自己负责这些活动,因为他们最了解自己数据的细微差别和复杂程度。
从可视化图表1中,可以看到所有六所参与院校的研究型图书馆都提供“选择或申请数据重用许可”的支持,而66%的研究人员报告称他们没有进行这一活动。提供数据重用许可对所有研究人员都很重要,因为这有助于用户理解数据以及应该如何根据数据创作者、机构和可能的资助方的利益来使用。此外,22%的研究人员报告称,当他们选择或申请数据重用许可时,他们会获得机构的帮助,而7%的报告称得到了外部帮助。
这表明图书馆可以提高研究人员对这些支持服务的认识。此外,图书馆应考虑与研究办公室或提供知识产权支持的中央单位建立合作伙伴关系,来更好地处理与研究数据相关的许可和知识产权问题。
尽管研究型图书馆已经为一些数据共享活动建立了支持服务,但大多数受访研究人员表示他们通常自己或在研究小组内完成这些活动。例如,六所受访机构中的五个研究图书馆管理员表示,他们提供关于“决定共享或托管哪些数据”和“准备数据共享”的帮助,但这同时也是受访研究人员表示自己完成的前两项数据共享活动。
研究人员在准备数据管理计划时也可能会受益于图书馆的支持。受访研究人员报告称,他们有85%的情况下是自己准备这些计划的。此外,六所机构中有五个研究图书馆提供帮助,协助选择适当的存储库(或多个存储库),以广泛共享研究数据。大多数研究人员表示,他们自己或通过机构帮助并没有进行这一活动,只有8%的研究人员报告说他们通过外部帮助进行这一活动。
此外,研究型图书馆通常提供存储库服务,帮助研究人员为其公开数据集获取持久标识符(PID,如DOIs、RORs、ORCIDs)。PID分配是一个关键的数据共享活动,因为PID可以在元数据、出版物、其他研究产品和产出、作者以及机构隶属之间建立链接。当内部存储库未被使用时,图书馆人员可能会为研究人员寻找合适的外部存储库以及提供如何从外部存储库获取PID的咨询。在为共享数据分配PID的研究人员中,仅有20%的人报告称得到内部帮助。这些低比例表明,虽然一些研究人员已经使用了这些服务,但显然还有更多的研究人员未使用。
图书馆的高级领导应与其他机构研究支持办公室的管理层合作,制定更广泛推广PID在共享研究产品(包括数据)中的应用的策略。
综上所述,研究型图书馆提供的这些数据共享服务可能未被研究人员充分利用,对此,可以通过以下两种方式改善:
(1)增加机构资源,以提高研究人员对这些服务的认识;
(2)加强宣传活动,鼓励研究人员在所在机构寻求这些服务。
第四部分:结论
通过对六所院校的研究人员数据共享活动及其机构支持的分析,可以得出结论,研究人员应该进一步利用机构提供的支持来完成许多数据管理和共享活动。对于这些活动,机构支持存在一个或多个部门。具体来说,这些活动包括:
? 制定DMPs(数据管理计划)或DMSPs(数据管理和共享计划)
? 制定MTAs(材料转让协议)和/或DUAs(数据使用协议)
? 确定应包含在资助预算中的数据管理和共享成本
? 在适当情况下确保数据安全
? 创建质量控制机制或程序
? 决定哪些数据可以共享或托管
? 创建持久标识符(例如,DOIs)
? 选择或应用数据重用许可
? 准备数据共享(例如,去识别化、选择、策展、数据清理、验证和质量控制)
? 决定如何处理和移除研究数据
? 确保满足资助机构的数据共享要求
近一半的研究人员报告称,他们在制定资助预算的规划阶段没有考虑数据管理和共享成本。但数据共享无疑需要成本,适当的资源分配能够提高有效数据共享的可能性。研究人员自己或在研究小组内完成的部分活动,可以通过机构各部门之间的协调支持获得更多益处。院校应该考虑成立跨机构的研究数据管理工作组或委员会,以协调对公共数据共享的支持。研究型图书馆在引领此类协调活动方面具有良好的优势。
研究结果显示,研究型图书馆在机构满足研究数据公共访问要求的能力中发挥着重要作用,尤其是在以下三个阶段:
(1) 项目的规划、设计和启动;
(2) 数据保留,包括保存、归档和长期访问;
(3) 广泛提供数据。
研究型图书馆提供的数据共享服务可能未被充分利用,因此可以通过加强校园宣传以及资助方代表的推动,鼓励研究人员在所在机构寻求这些服务。
此外,参与此次调查的机构中,有一半的研究所和某些特定中心的管理人员报告显示,他们在整个研究生命周期内提供了对所有27项数据管理和共享活动的支持。研究所和某些特定中心为机构提供了一个试验各种数据共享努力的平台,并在全校范围内推广这些服务之前,评估其成本和影响。
基于这些见解,我们鼓励其他研究组织进行类似的机构调查,并协调数据共享支持和研究人员的数据共享活动,以提高机构效率。这类研究对于识别关键支持部门、找出机构研究数据管理和共享支持中的服务缺口,以及进行有针对性的宣传非常重要。这些缺口分析不仅提供了当地数据管理和共享支持现状的概览,还为增强跨机构的研究数据管理支持协调奠定了关键基础。