《不同学科间开放科学实践的差异》

  • 来源专题:科技期刊发展智库
  • 编译者: 孟美任
  • 发布时间:2023-10-23
  • 不同的研究社群在交流其研究成果时有着不同的优先事项、需求、规范和挑战。因此,不同的主题和学科采用的开放科学实践也是不同的。开放科学指标(Open Science Indicators,OSI)以一种前所未有的方式揭示了不同学科采用开放科学的模式。PLOS根据最新的开放科学指标数据集,分享开放科学实践方面有关学科差异的初步观察结果。

    关于本文的分析

    OSI使用自然语言处理和人工智能技术识别和量化开放科学实践。数据集包括2019年1月1日至2023年3月31日期间PLOS发表的74,130篇研究论文,以及从PMC(PubMed Central))中爬取的8,186篇开放获取论文作为对比数据。开放科学实践包括数据共享、代码共享和预印本发布。

    OSI数据集的数据项包括每篇论文的DOI,因此很容易与索引和归档服务中使用的一系列分类标准进行匹配,从而获取学科数据。在本文分析中,选择了适用于维度数据的澳大利亚和新西兰标准研究分类法(Australian and New Zealand Standard Research Classification, ANZSRC)。由于它是一个开放的分类体系,因此可以很容易地提取和重建。

    由于一篇论文可能属于多个主题,因此在分析中可能会被计算多次。

    数据库的使用

    虽然以任何形式共享的数据都有其价值,但数据库通常认定的黄金标准是实现最大程度的可发现性、可访问性和实用性。本文的分析重点是数据库的使用情况,但也可以通过OSI 数据集计算出广泛的数据共享率。

    无论是在不同学科之间,还是同一学科下PLOS论文和对比论文之间,数据库的使用情况都大相径庭。就PLOS论文而言,数据库使用率最低的学科是健康科学(PLOS为19%,对比数据集为6%)和生物医学与临床科学(PLOS为19%,对比数据集为10%)。这两个学科都可能受到隐私因素的影响。此外,数据库使用率低于平均水平的学科有工程学、农业和地球科学,这些学科的专有数据很常见。在对比数据集上得到了类似但不完全相同的结果,使用率最低的是工程学(5%)和健康科学(6%)。

    相反,信息与计算科学、心理学和生物科学的使用率较高。生物科学的使用率较高,而且PLOS与对比数据的使用率相似,这主要是由于学科规范和强制性的数据存档要求。参见图1。

    在不同学科最常使用的数据库类型方面,生物科学、农业和生物医学与临床科学最有可能使用学科范围较窄的专业数据库,这可能是受到测序、遗传学、晶体学和大分子数据领域的强制性数据缴存的影响。参见图2。

    图2 不同学科使用数据库的类型分析结果

    (注:各主题在对比数据集中都包含超过100篇论文,与上图中的主题领域一致。涉及PLOS数据集中最常引用的15个数据库,在PLOS数据集中占94%,占对比数据集84%。每篇论文可能有不止一个与之相关的数据库,因此有些主题的总和超过了100%)

    代码共享

    用开放获取的代码充实研究文章可以加深理解、促进可重复性和再分析、增强可信度,并为其他研究人员节省时间和精力。

    事实上,代码生成与代码共享的关系似乎并不密切。在代码生成率较高的主题领域,代码共享率分布广泛。例如,数学、信息与计算科学和物理科学的代码生成率和代码共享率都较高,而生物科学、环境科学和化学科学的代码生成率较高,但代码共享率却较低。

    相反,代码共享行为似乎与数据库中共享的数据高度相关,这表明既定的数据共享规范(而非代码的普遍性/相关性)是决定性因素。参见图3。

    预印本发布

    预印本使研究人员能够更好地控制他们的科学交流,及早分享,以确立首发权、发布成果、寻求社区反馈、吸引读者群,并有助于申请基金、工作或终身职位。

    作为2022年年终分析的一部分,本文还探讨了不同时期和不同地区的预印本发布模式。按学科对数据进行分析,在PLOS和对比数据中,生物科学的预印本发布率最高。生物学是PLOS发表论文最多的主题领域之一,而且生物学预印本平台bioRxiv也是PLOS第一个官方合作的平台。

    PLOS还在生物医学与临床科学领域与medRxiv建立了预印本合作关系,最近又在地球与环境科学领域与EarthArXiv建立了合作关系,PLOS在这两个领域都有较多发文。值得注意的是,在生物医学和临床科学领域,PLOS与对比数据集的预印本发布率非常接近,能够在一定程度上说明,在这一学科中,便捷的发表方式对是否采用预印发布的影响较小。在地球与环境科学领域,预印本发布率普遍低于平均水平,而且与对比数据相比,各分支学科的预印本发布率也不尽相同。参见图4。

    这只是OSI所开展的探索性研究,学科级开放科学数据的未来走向值得关注。

相关报告
  • 《早期研究人员的开放科学实践指南》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2023-07-11
    • 荷兰大学图书馆联盟和荷兰国家图书馆(UKB)与荷兰大学(UNL)、荷兰国家研究数据专业中心和荷兰研究委员会(NWO)共同发布了一本关于开放科学的实用指南。 开放科学 可靠的科学不是仅靠超人智慧的工作,而是一个协作的过程。研究人员依赖并建立在彼此的研究成果上。我们共同构建理论、收集证据和评估同行的研究。然而,只有当我们确切地了解我们的前辈所做的事情时,我们才能建立在他们的工作基础上:他们的方法、相关材料、数据和结果是什么?因此,健全的科学理想上等同于开放科学,其中研究周期的所有阶段都尽可能透明和可访问。 关于本指南 刚开始的研究人员在向开放科学的转变中扮演着重要角色,因此这份指南面向荷兰大学和研究机构的所有学科的博士候选人、研究硕士学生和早期职业研究人员。它旨在陪伴研究人员在他们研究的每个阶段,从准备研究项目和发现相关资源(第2章)到数据收集和分析(第3章),撰写和发表文章、数据和其他研究成果(第4章),以及推广和评估(第5章)。每一章都为您提供了最佳的工具和实践,以便立即实施。您可以在当地的开放科学社区(见第6章)和大学图书馆找到其他研究人员或支持人员。 本指南建立在"开放科学的护照.针对博士生的实用指南"的基础上,由Loek Brinkman,Elly Dijk,Hans de Jonge,Nicole Loorbach,Daan Rutten等人撰写。(Paris, 2020)。 知识共享许可 CC BY-SA 4.0 授权。
  • 《开放科学是更好的科学》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-10-23
    • 开放科学运动的核心是坚信开放科学是更好的科学——更严谨、更具包容性、更高效、更值得信赖、更可复制,对社会更有影响力。 开放科学实践的各个方面(从开放方法和数据,到预印本,到ORCID和CRediT,再到开放同行评议)都是相辅相成的循环的一部分。每一个组成部分都相互配合,随着开放科学普及率的提高,效益也会增加,并不断向外扩展,重塑研究体系,最终产生更好的科学。 PLOS的使命是引领这种变革。要实现这一目标,最好的办法就是让研究人员能够大规模地参与基本的开放科学实践,具体做法如下:(1)提供符合研究人员以及公众目标和优先事项的开放科学选项;(2)消除障碍,提升所有研究人员使用开放科学的机会。 PLOS于2003年推出PLOS Biology,帮助证明了开放获取期刊的可行性,并于2009年推出PLOS ONE,让更多研究人员能够实现开放获取。2014年,PLOS首创数据可用性政策重新设定了整个行业的数据共享标准。简化预印本合作方式减轻研究人员的行政负担,使早期共享正常化,并增加了对新科学的获取能力。 为了更好地了解研究人员的需求,激励开放实践以提高研究质量和可靠性,并增加对开放出版选项的访问。PLOS对现阶段的工作进行总结如下: 开放科学指标(OSIs) 为了提高开放科学实践的普及率,我们需要能够可靠地衡量开放科学实践。开放科学指标(OSIs)使用自然语言处理技术识别和量化已发表文献中的开放科学行为,并比较不同学科、地区和其他因素的生成率和使用率从而能够更好地了解和满足研究人员的需求;通过公开数据集,希望也能支持PLOS以外的研究工作。目前,OSI数据集包括数据共享、代码共享和预印本,未来将纳入更多指标。 可获取的数据 读者依靠原始科学数据来理解、验证、复制和再分析,并为未来的调研、系统综述和荟萃分析提供信息。但研究人员只有知道数据的存在,才能获取和使用数据。PLOS的“可访问数据”功能是一项试验性功能,它提高了PLOS论文页面上关联数据的可见度。通过这种方式突出显示可公开获取的数据,促进数据的获取和再利用,节省读者在线搜索公共数据的时间。在第一年取得成功后,"可访问数据"功能最近从最初的三台服务器扩展到九台。 超越文章处理费 文章处理费(Article Processing Charges, APC)证明了开放获取的可行性。但是,APCs也具有排斥性和不公平性;对作者来说负担沉重,对出版商来说管理起来费时费力;而且往往会产生以量取胜的激励机制。PLOS正在超越 APCs,采用新的资助模式,更公平地分配出版成本,减少每个人的支出,包括社区行动出版和机构协议。