《早期研究人员的开放科学实践指南》

  • 来源专题:数智化图书情报
  • 编译者: 程冰
  • 发布时间:2023-07-11
  • 荷兰大学图书馆联盟和荷兰国家图书馆(UKB)与荷兰大学(UNL)、荷兰国家研究数据专业中心和荷兰研究委员会(NWO)共同发布了一本关于开放科学的实用指南。

    开放科学

    可靠的科学不是仅靠超人智慧的工作,而是一个协作的过程。研究人员依赖并建立在彼此的研究成果上。我们共同构建理论、收集证据和评估同行的研究。然而,只有当我们确切地了解我们的前辈所做的事情时,我们才能建立在他们的工作基础上:他们的方法、相关材料、数据和结果是什么?因此,健全的科学理想上等同于开放科学,其中研究周期的所有阶段都尽可能透明和可访问。

    关于本指南

    刚开始的研究人员在向开放科学的转变中扮演着重要角色,因此这份指南面向荷兰大学和研究机构的所有学科的博士候选人、研究硕士学生和早期职业研究人员。它旨在陪伴研究人员在他们研究的每个阶段,从准备研究项目和发现相关资源(第2章)到数据收集和分析(第3章),撰写和发表文章、数据和其他研究成果(第4章),以及推广和评估(第5章)。每一章都为您提供了最佳的工具和实践,以便立即实施。您可以在当地的开放科学社区(见第6章)和大学图书馆找到其他研究人员或支持人员。

    本指南建立在"开放科学的护照.针对博士生的实用指南"的基础上,由Loek Brinkman,Elly Dijk,Hans de Jonge,Nicole Loorbach,Daan Rutten等人撰写。(Paris, 2020)。

    知识共享许可 CC BY-SA 4.0 授权。

相关报告
  • 《不同学科间开放科学实践的差异》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-10-23
    • 不同的研究社群在交流其研究成果时有着不同的优先事项、需求、规范和挑战。因此,不同的主题和学科采用的开放科学实践也是不同的。开放科学指标(Open Science Indicators,OSI)以一种前所未有的方式揭示了不同学科采用开放科学的模式。PLOS根据最新的开放科学指标数据集,分享开放科学实践方面有关学科差异的初步观察结果。 关于本文的分析 OSI使用自然语言处理和人工智能技术识别和量化开放科学实践。数据集包括2019年1月1日至2023年3月31日期间PLOS发表的74,130篇研究论文,以及从PMC(PubMed Central))中爬取的8,186篇开放获取论文作为对比数据。开放科学实践包括数据共享、代码共享和预印本发布。 OSI数据集的数据项包括每篇论文的DOI,因此很容易与索引和归档服务中使用的一系列分类标准进行匹配,从而获取学科数据。在本文分析中,选择了适用于维度数据的澳大利亚和新西兰标准研究分类法(Australian and New Zealand Standard Research Classification, ANZSRC)。由于它是一个开放的分类体系,因此可以很容易地提取和重建。 由于一篇论文可能属于多个主题,因此在分析中可能会被计算多次。 数据库的使用 虽然以任何形式共享的数据都有其价值,但数据库通常认定的黄金标准是实现最大程度的可发现性、可访问性和实用性。本文的分析重点是数据库的使用情况,但也可以通过OSI 数据集计算出广泛的数据共享率。 无论是在不同学科之间,还是同一学科下PLOS论文和对比论文之间,数据库的使用情况都大相径庭。就PLOS论文而言,数据库使用率最低的学科是健康科学(PLOS为19%,对比数据集为6%)和生物医学与临床科学(PLOS为19%,对比数据集为10%)。这两个学科都可能受到隐私因素的影响。此外,数据库使用率低于平均水平的学科有工程学、农业和地球科学,这些学科的专有数据很常见。在对比数据集上得到了类似但不完全相同的结果,使用率最低的是工程学(5%)和健康科学(6%)。 相反,信息与计算科学、心理学和生物科学的使用率较高。生物科学的使用率较高,而且PLOS与对比数据的使用率相似,这主要是由于学科规范和强制性的数据存档要求。参见图1。 在不同学科最常使用的数据库类型方面,生物科学、农业和生物医学与临床科学最有可能使用学科范围较窄的专业数据库,这可能是受到测序、遗传学、晶体学和大分子数据领域的强制性数据缴存的影响。参见图2。 图2 不同学科使用数据库的类型分析结果 (注:各主题在对比数据集中都包含超过100篇论文,与上图中的主题领域一致。涉及PLOS数据集中最常引用的15个数据库,在PLOS数据集中占94%,占对比数据集84%。每篇论文可能有不止一个与之相关的数据库,因此有些主题的总和超过了100%) 代码共享 用开放获取的代码充实研究文章可以加深理解、促进可重复性和再分析、增强可信度,并为其他研究人员节省时间和精力。 事实上,代码生成与代码共享的关系似乎并不密切。在代码生成率较高的主题领域,代码共享率分布广泛。例如,数学、信息与计算科学和物理科学的代码生成率和代码共享率都较高,而生物科学、环境科学和化学科学的代码生成率较高,但代码共享率却较低。 相反,代码共享行为似乎与数据库中共享的数据高度相关,这表明既定的数据共享规范(而非代码的普遍性/相关性)是决定性因素。参见图3。 预印本发布 预印本使研究人员能够更好地控制他们的科学交流,及早分享,以确立首发权、发布成果、寻求社区反馈、吸引读者群,并有助于申请基金、工作或终身职位。 作为2022年年终分析的一部分,本文还探讨了不同时期和不同地区的预印本发布模式。按学科对数据进行分析,在PLOS和对比数据中,生物科学的预印本发布率最高。生物学是PLOS发表论文最多的主题领域之一,而且生物学预印本平台bioRxiv也是PLOS第一个官方合作的平台。 PLOS还在生物医学与临床科学领域与medRxiv建立了预印本合作关系,最近又在地球与环境科学领域与EarthArXiv建立了合作关系,PLOS在这两个领域都有较多发文。值得注意的是,在生物医学和临床科学领域,PLOS与对比数据集的预印本发布率非常接近,能够在一定程度上说明,在这一学科中,便捷的发表方式对是否采用预印发布的影响较小。在地球与环境科学领域,预印本发布率普遍低于平均水平,而且与对比数据相比,各分支学科的预印本发布率也不尽相同。参见图4。 这只是OSI所开展的探索性研究,学科级开放科学数据的未来走向值得关注。
  • 《PLOS和DataSeer扩大合作伙伴关系,以更好地了解研究人员的开放科学实践》

    • 来源专题:科技期刊发展智库
    • 编译者:唐果媛
    • 发布时间:2022-10-19
    •   2022年9月21日,公共科学图书馆(PLOS)和DataSeer宣布了一个扩展的伙伴关系,将为PLOS期刊如何支持开放科学实践提供新的见解。今年早些时候,PLOS和DataSeer合作开展了一个项目,以量化PLOS计算生物学的代码共享。这一扩大的伙伴关系将使公共科学图书馆能够评估其所有期刊和内容中的三个关键“开放科学指标”——代码共享、预印本发布和存储库中的数据共享。明年将制定更多指标。   PLOS开放研究解决方案总监Iain Hrynaszkiewicz说到,为了增加对开放科学的采用并实现其好处,我们需要了解研究人员是否采用了这些做法,采用的障碍是什么,并了解社区之间的差异。与DataSeer合作,可以更好地了解我们所服务的研究人员,并帮助改进一系列开放科学实践的采用。   DataSeer将首先分析2019年至今发表的66,000多篇PLOS文章,然后每月重复分析新发表的内容。他们将向PLOS提供有关使用数据存储库、公开共享代码和共享预印本的信息。这是出版商首次提出此类倡议,今年晚些时候完成分析后,公共科学图书馆将分享第一组结果。   已经与DataSeer建立的合作,可以通过自然语言处理和人工智能驱动技术,测量代码共享功能。DataSeer正在创建分析预印本共享的能力,以结合DataSeer用于评估研究数据共享的成熟方法。   DataSeer创始人兼总监Tim Vines表示,与PLOS合作可以探索作者如何通过已发表的文章共享不同的研究对象。这些信息对于理解研究人员的实践以及推动研究和学术出版的系统性变革至关重要。   PLOS和DataSeer还将研究PLOS之外的相关内容,以更好地评估其他期刊上的相同开放科学指标,并进行比较。除了帮助PLOS更好地服务于采用开放科学实践的研究社区外,PLOS还旨在与研究人员、政策制定者、机构和其他出版商共享开放科学指标数据,以使他们能够就自己的政策和实践做出知情决策。   在过去两年中,为共享协议、代码、研究数据和预印本引入了新的解决方案,旨在支持PLOS使开放科学实践成为规范的目标。