《提供科研数据公共获取的成本:机构及科研人员花费预估》

  • 来源专题:科技出版市场动态监测
  • 编译者: 崔颖
  • 发布时间:2024-08-04
  • 一、机构行政开支

    数据管理服务(DMS)需要众多机构办公室之间的协调,以及研究团队的时间和投入,以满足联邦、出版商和机构的各种政策要求。

    为了规范研究型大学内部的结构差异,分为四个主要的机构服务领域:

    • IT办公室——信息技术,包括研究计算;
    • 图书馆——大学图书馆和档案馆;
    • 研究所和中心——专门的研究所和中心,包括学院和部门研究办公室;
    • 研究办公室——中央研究办公室,包括合规办公室、法律办公室和赠款管理办公室。

    我们对每个机构服务领域的各个单位进行了平均开支计算,以得出每个机构服务领域的总开支。

    1、机构服务领域的年度总开支

    机构内数据管理服务(DMS)员工和行政区域基础设施的平均年度开支约为75万美元。

    当我们按服务领域细分这一年度开支时,图书馆的平均年度成本最高,其次是信息技术(IT)。这些开支包括为提供DMS服务所需的人员和基础设施(如技术)费用。

    表1按机构服务领域划分,支持6个机构的研究DMS活动的平均年度成本

    图1按员工和基础设施将每个机构服务领域的年度总开支进行了细分。该图显示,图书馆的员工开支高于其他领域,而基础设施开支在所有服务领域中则相对一致。

    图1 机构服务区域数据管理服务(DMS)的平均年度成本按员工和基础设施细分

    2、机构服务区域预计的未来投资

    图书馆、信息技术(IT)和研究部门报告称,预计在未来五年内将在员工或基础设施上进行大量投资,以支持数据管理服务(DMS)。

    图2显示了受访者预计在未来五年内相对于当前开支将增加的投资水平(员工和基础设施)。

    图2.未来五年内,相对于当前支出,按数据管理系统(DMS)类别划分的预期投资水平(人员或基础设施)

    二、研究人员开支

    数据管理系统(DMS)政策的合规性通常由机构部门和获得资助奖励的研究人员共同实现。因此,除了评估支持DMS所需的基础设施、人员配置和服务的机构支出外,我们还评估了研究人员在满足联邦DMS政策方面所产生的费用。

    为了评估研究人员的支出,我们询问了已完成资助项目的主要研究人员(PI)在DMS活动方面的支出情况,包括技术基础设施(如硬件、存储和软件)和人员配置(如学生和数据管理员的时间和薪酬)。我们还询问了这些费用是否仅通过资助获得,还是由实验室或部门资金进行了补充。最后,评估了研究人员报告的支出与DMS活动之间的关系。分析回顾2013年美国科学技术政策办公室(OSTP)发布“增加获取联邦资助科学研究结果的机会”备忘录后完成的资助项目,这是制定美国联邦机构数据管理政策的里程碑式任务,旨在管理联邦资助研究产生的数据。

    1、资助期内的平均DMS费用

    整个资助周期内研究人员在数据管理系统(DMS)服务和基础设施上的平均支出为29,800美元,占其资助金额的5.83%。

    在整个资助周期内,所有受访者在DMS上的平均支出为29,800美元,这相当于总资助金额的近6%。为了解不同资助规模之间的差异,我们根据总资助金额的百分位数对样本进行了划分。在总资助金额最高的25%的研究资助中,DMS的支出高于中间50%或最低的25%(表2)。

    然而,虽然对于那些获得较大总补助金的人来说,绝对费用较高,但这些费用在补助金总额中所占的百分比较小。在我们的样本中,较小的赠款费用(平均奖励金额为149,000美元)的平均DMS支出略高于其总奖励金额的15%,其中三分之二用于DMS活动的工作人员时间。这一发现进一步表明,DMS活动具有非凡的相关费用。因此,这可能会对授予金额较小与授予金额较大的PI的DMS要求感知负担的差异产生影响。

    表2.按奖励金额百分位数分列的DMS平均支出

    总费用与奖励比例的显著差异如图3所示。该图显示了DMS总平均支出和用于DMS的总奖励的百分比,以平均总赠款的百分位数表示。虽然较大的奖励金的DMS总支出较高,但与较小奖励规模的项目相比,这些费用在总赠款中所占的比例要小得多。

    图3.当归入总体奖励百分位数时,平均DMS成本和平均DMS费用占赠款的百分比并排比较

    2、研究人员资金来源

    除了收集费用信息外,我们还询问了研究人员他们的DMS费用的预算来源是什么。如图4所示,大部分预算来自赠款,但百分比也来自部门、学院、实验室或其他资金。这一数字还表明,资金来源似乎与赠款总额无关。换句话说,获得较小和较大奖励的研究人员都使用赠款以外的资金来支付他们的部分DMS费用。

    图4. 2013-2022年完成的项目按奖励百分位数划分的研究人员获得数据管理和共享活动资金的比较

    3、按学科分列的资助期内的平均DMS支出

    研究回顾性地收集了五个学科领域的资助费用信息(2013-2022年):生物医学科学、环境科学、材料科学、物理学和心理学。

    我们有意将搜索范围限制在这些学科上,以捕捉每个机构进行的研究的广度。然而,如表3和图5所示,除心理学研究外,不同学科的DMS成本差异比预期的要少(表3)。从标准差可以看出,一个学科内的DMS成本存在相当大的差异。然而,需要注意的是,按学科划分时的样本量非常小,因此在根据这些数据推断学科差异时必须谨慎。

    表3.按平均纪律处分补助金金额分列的平均数据管理和共享支出

    (注:材料科学的受访者少于5人,因此未显示他们的平均值。)

    图5.按学科划分的平均DMS支出和授予赠款总额的百分位数

    由于奖励百分位数是在整个样本中计算的,因此并非所有学科在每个百分位数组中都有奖项(例如,在我们样本的前25%中没有物理学或环境科学的奖项)。

    4、按资助机构分列的赠款期内的平均DMS支出

    • 美国国立卫生研究院(NIH)资助的研究人员报告显示,在项目的整个生命周期中,DMS的总费用平均为36,000美元。
    • 美国国家科学基金会(NSF)资助的研究人员报告显示,在项目的整个生命周期中,DMS的总费用平均为19,000美元。
    • 由于样本量为<5,因此未分析针对美国能源部资助的研究人员的特定费用。

    我们按资助机构和总赠款奖励分析了DMS费用数据。虽然这些费用不一定在最初的赠款提案中直接编制预算,甚至也不完全由赠款基金直接支付,但此次分析是为了帮助机构和资助者更好地预测机构特定赠款提案中未来的DMS成本。

    当我们根据资金的百分位数分析结果时,我们发现DMS的费用在每个资助者平均赠款总额的较低25%和中间50%之间相当一致。对于NIH,这些费用约为28,000美元,对于NSF,这些费用约为12,000美元(见表4和图6)。然而,值得注意的是,这些费用对应于这两个群体的赠款奖励的百分比截然不同,较小的赠款面临更高的负担。

    在抽样中排名前25%的赠款中,DMS活动的费用几乎翻了一番,平均而言,在赠款中所占的百分比要小得多。

    表4.按资助者划分的用于数据管理和分摊费用的平均奖励百分比

    机构和数据管理专业人员可能需要考虑根据资助机构的这些费用百分比和平均赠款奖励金额提供DMS预算建议。

    图6.按资助者和授予赠款总额的百分位数划分的平均DMS支出(此处的百分位数是在资助者内部计算的,而不是在所有奖励中计算的)。由于样本量小(n=3),DOE被排除在外。

    三、扩大机构开支

    在这项研究包括的机构中,机构在DMS服务和基础设施方面的平均年支出(将行政费用与研究人员费用相结合)约为2,500,000美元,范围在800,000美元至6,000,000美元之间。

    1、DMS费用与DMS活动之间的关系

    我们的分析发现,独立完成DMS活动的研究人员每次活动的DMS费用增加了约2,700美元。

    如图7所示,研究人员自行完成的DMS活动数量(没有机构服务单位或外部支持,如学科存储库)与更高的DMS总成本显着相关。类似的回归分析发现DMS费用与在机构支持下完成的DMS活动之间没有显着关联,如图7所示。在外部支持下完成的DMS活动之间没有统计学上的显著关系。

    图7. DMS费用与执行DMS活动的人员之间的关系

    2、按数据共享位置(机构、通用或专用存储库和个人网站)划分的平均DMS费用

    平均而言,当研究人员在机构存储库或机构数据存储库中共享数据时,他们为DMS花费了大约7,200美元,而使用其他平台(例如通用和专业存储库和个人网站)的研究人员为35,000美元。

  • 原文来源:https://www.arl.org/resources/making-research-data-publicly-accessible-estimates-of-institutional-researcher-expenses/
相关报告
  • 《ARL发表关于“提高联邦财政资助的科学研究数据的公共获取”计划的意见》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2024-07-07
    • 2024年5月13日,美国社会保障局(SSA)发布了“增加公众获取联邦资助科学研究成果的计划(SSA-2023-0039)”的信息请求。美国研究图书馆协会(ARL)针对这一请求提出以下意见。 美国研究图书馆协会对社会保障局增加公众获取联邦资助科学研究成果的计划的信息请求发表评论 信息请求:美国社会保障局增加公众获得联邦资助科学研究成果的计划(SSA-2023-0039) 发表评论: 1. 公共获取的范围和适用性 公共访问计划定义了可公开访问的研究范围,包括保护个人身份信息隐私的限制。当我们实施公共访问计划时,我们是否应该考虑其他公共访问? 可访问性:确保最终发布的PDF版本可访问对于公平交付联邦资助的研究成果至关重要。虽然学术著作的出版商最适合有效地整合无障碍功能,但出版商提供的PDF并不总是符合第508条的规定。我们建议公众访问计划包括根据美国版权法对不合规作品进行补救的策略。 权利和复用:美国社会保障局计划指出,“研究人员必须确保最终出版物被允许在美国社会保障局指定的存储库中提供”。我们建议最终出版物、研究数据和其他已发布的输出具有完全的重用权,例如CC BY 4.0国际许可证或其等效功能提供的重用权,而不仅仅是在存储库中提供出版物、数据或其他输出的权利。完全的公共重用可以实现广泛的二次分析,允许其他人在原始工作的基础上进行构建,扩展研究成果,并应用创新方法,包括文本和数据挖掘、人工智能部署和其他计算技术。 2. 数字仓储库 在适用法律允许的范围内,我们将要求联邦政府资助的科学研究成果可以免费向公众开放,包括最终科学研究报告、同行评审的学术出版物以及用于生成报告和出版物的基础科学研究数据。我们将要求最终研究出版物被允许在美国社会保障局指定的存储库中提供,我们将在2024年选择该仓储库。基础科学研究数据必须以符合美国社会保障局要求的形式存放在仓储库中。 美国研究图书馆协会的成员研究图书馆(包括公共、学术和政府图书馆)支持跨学科的研究人员存储、保存和公开访问他们的出版物和研究数据。许多提供基础设施,通常通过机构存储库或机构数据仓储库。除了满足技术要求外,图书馆还提供当地图书馆员或其他专业人员的宝贵帮助,以指导研究人员遵守公共访问政策和金色标准的FAIR数据共享。研究人员重视对机构仓储库的本地支持,这些仓储库提供强大的基础设施、全面的元数据标准以及强大的数据保存和可访问性功能。许多机构仓储库和机构数据仓储库都符合这些标准,并且与联邦资助研究的数据仓储库的理想特征中概述的标准非常吻合。 当美国社会保障局制定数据仓储库的要求时,必须清楚地确定存储库必须具有的特征和功能,而不是联邦资助研究数据仓储库的理想特征报告中提到的特征和功能。这包括为不构成美国社会保障局指定仓储库的内容制定明确、客观的指导方针。 3. 成本 美国研究图书馆协会研究发现,在其奖励项目的整个生命周期(从授予前到结束)中,每个奖励的平均支出为29,800美元(图1)。 图1 DMS服务平均年度成本细目 研究还发现,数据管理和共享的平均年度机构费用(研究人员费用加上基于机构的服务供应商费用)为2,500,000美元,范围从大约800,000美元到超过6,000,000美元不等。 值得注意的是,如图2所示,当利用机构服务(例如用于数据共享的机构存储库)时,与使用不同数据共享位置时的平均费用相比,研究人员用于数据管理和共享的平均费用较低。 图2每个资助研究项目的平均DMS成本 基于上述信息,并确保研究人员获得满足要求的支持,美国研究图书馆协会建议美国社会保障局: 通过与基于机构的服务供应者合作,教育和支持准备供公众共享的材料,最大限度地减少研究人员和机构的行政和财务负担。 指定数据管理和共享活动的成本,包括明确说明是否允许在授予后支付数据存储和存储库费用。 形成特定机制,确保在关闭后有资金用于出版和研究数据存储和/或分摊费用。对于早期职业、博士后和研究生研究人员来说,获奖后资金尤为重要,他们的出版和数据共享成本可能尚未计入最初的资助预算。 4. 美国社会保障局研究信息和培训 公共访问计划提供了有关网站的信息,并描述了研究计划。我们将考虑提供一个新的网页作为有关研究计划信息的单一访问点,包括如何查找可公开访问的研究出版物和数据。 为了支持研究人员及其机构了解公共访问要求,美国研究图书馆协会建议美国社会保障局考虑明确标识研究人员应使用的首选持久标识符(PID)。提供有关PID的具体指导为研究人员提供了明确的方向,并有助于建立跨学科的研究基础设施。报告《实施有效的数据实践》,包括高等教育协会的建议并推荐以下PID: ·每个出版物和研究成果(数据、代码、软件等)的数字对象标识符(DOI) ·开放研究人员和贡献者标识符(ORCID ID)以唯一标识作者 ·研究组织注册(ROR)ID,用于将作者与已知组织(包括资助者ID)联系起来 美国研究图书馆协会还建议与研究图书馆员更紧密地合作,以教育和告知其机构和组织的研究人员有关公共访问政策和合规工作流程的信息。 5. 公平研究 美国研究图书馆协会建议美国社会保障局允许在“同行评审的学术出版物”范围内使用预印本服务。利用预印本可以加速研究成果的共享。美国社会保障局应考虑承认与作者接受的稿件基本相似的同行评审预印本。这种方法为研究人员广泛传播他们的工作提供了直接途径。预印本存储库不收取访问费用,由此可以增加广大公众的公平访问。预印本存储使研究人员受益,因为他们的学术文章将更广泛地提供,从而增加使用和引用的可能性。美国研究图书馆协会鼓励美国社会保障局与研究机构及其图书馆合作,协调研究人员的教育出版工作。这些努力可以侧重于告知研究人员他们免费手稿存放的选择,有助于减轻出版的财务障碍。
  • 《开放科学:早期科研人员实践指南》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2023-11-12
    • 2023年6月9日,荷兰莱顿大学网站发布了《开放科学:早期科研人员实践指南》,这是由荷兰大学图书馆联盟、荷兰国家图书馆(UKB)、荷兰大学(UNL)、荷兰国家研究数据专业中心和荷兰研究委员会(NWO)共同发布的关于开放科学的实践指南。该指南适用于荷兰大学和研究机构所有学科的硕士生、博士生和早期科研人员。其目的是启迪和帮助科研人员开展开放科学实践、分享研究。 该指南包括六个章节,主要内容如下: 第一章:欢迎来到开放科学; 第二章:准备与发现,内容包括寻找利益相关者、公众科学、发现信息、发现数据、预注册、许可等内容; 第三章:采集与分析数据,内容包括数据管理计划(敏感数据、个人数据和数据最小化),可重复性(可重复实践、研究软件)、数据管理者; 第四章:写作与出版,内容包括预印本、开放出版(OA期刊论文、开放的封闭出版物、开放学位论文、开放专著)、开放与FAIR研究数据(FAIR方式分享数据、FAIR数据不同于开放数据、脱敏研究数据、传播研究数据、数据有效性、长期保存及数据库,研究数据许可)其他开放研究产出(开放教育、开放软件等); 第五章:推广与评估,内容包括开放同行评议与出版同行评议、科学交流、开放科学的激励与认可、开放科学的研究资助政策等; 第六章: 加入行动。 该实践指南遵循CC BY-SA 4.0知识共享许可,撰写作者为: Loek Brinkman, DANS, OSC-NL. loek.brinkman@dans.knaw.nl orcid: 0000-0003-3997-1173; Elly Dijk, DANS. elly.dijk@dans.knaw.nl orcid: 0000-0002-5089-8774 ; Hans de Jonge, NWO. h.dejonge@nwo.nl orcid: 0000-0002-1189-9133 ; Nicole Loorbach, University of Twente. n.r.loorbach@utwente.nl orcid: 0000-0002-2766-8567; Daan Rutten, Tilburg University. d.rutten@tilburguniversity.edu orcid: 0000-0002-6645-9581