2022年3月,在惠康基金会的支持下,PLOS推出了实验性的“可访问数据”功能,旨在促进研究数据的共享和再利用。在得到一些初步成果后,正在扩大"可访问数据"实验范围。
5.1“可访问数据”实验下一阶段要实现的目标
“可访问数据”实验有两个初始目标:
(1)提高PLOS论文关联数据集的再利用率;
(2)通过在文章上显示提示/奖励,提高资源库的使用率。
在实验的下一阶段,还有一个额外目标:即了解读者在使用不同类型的数据和研究成果时是否存在差异。
为了实现以上目标,PLOS将增加符合条件的论文数量,使关联的资源库和产出类型多样化。在下一阶段,符合以下条件的文章将显示图标:
(1)2016年后发表;
(2)其数据可用性声明中包含指向资源库中研究成果的链接;
(3)链接指向资源库中的唯一记录,资源库包括Dryad、Figshare、Open Science Framework (OSF)、Github、Zenodo、Gene Expression Omnibus、Sequence Read Archive、BioProject 和 Demographic and Health Surveys。
为关联到6个资源库(Github、Zenodo、Gene Expression Omnibus、Sequence Read Archive、BioProject 和 Demographic and Health Surveys)的文章增加图标可以达到两个目的。首先,有资格使用该功能的文章数量增加了三倍,达到15,000余篇,使更多的研究人员获益,提高了促进研究数据和代码发现的能力。其次,增加了不同类型的资源库,从而提高了学习潜力。Dryad、Figshare和OSF是通用型资源库,Gene Expression Omnibus、Sequence Read Archive和BioProject是生命科学领域常用的专业领域资源,而Demographic and Health Surveys则包含社会科学和医学领域的重要资源。以领域为重点的资源库往往对数据和(或)元数据的结构有更具体的要求,PLOS希望了解读者在使用专业领域资源时是否会与使用通用型资源库的内容有所不同。
Github以代码和软件共享、版本管理而闻名,但也经常用于其他内容,包括研究数据。随着代码共享率的提高,以及PLOS大约一半的研究都使用或产生了代码,PLOS希望更好地了解链接到PLOS论文的代码的价值,并支持共享研究成果的关联数据。事实上,所有新添加的资源库在PLOS作者中都很受欢迎——PLOS作者在资源库中共享的成果,约有3/4缴存在以上9个资源库中。这些资源库也与PLOS创建的简单工具相兼容,能够自动创建链接,在某些情况下,还可以"即时"根据入库编号而不是URL创建链接。
5.2 到目前为止的一些统计数据
(1)读者正在使用可访问数据图标
在实验的前12个月(截至2023年3月),共记录了20,000多次读者对图标的点击,在2022年3月首次推出时,该图标显示在3,335篇论文上,在推出后的12个月,又增加了1,200多篇论文。通过分析与PLOS论文关联的543个Figshare数据集,可以发现,在推出该功能之前的12个月中,每月平均浏览量为2.5次,而在推出后的12个月,每月平均浏览量为3.0次(在统计意义上相对增加了20%)。
(2)图标可影响未来的数据共享实践
2019年至今,已发表的PLOS论文作者对资源库的使用率正在上升。但目前还无法衡量"可访问数据"图标是否影响PLOS作者在资源库中的数据共享率,因为实验开展的时间还不够长,无法衡量对已发表论文的影响。不过,研究表明,该图标的可用性可能有助于数据共享的规范化,并影响研究人员选择哪个资源库。
(3)在论文中提供"正确的"数据链接仍然是出版商和作者面临的一项挑战
可访问数据图标鼓励通过网络链接到共享资源库中的数据和代码。最佳实践是通过可链接的持久性标识符(如DOI)进行共享,但许多PLOS论文以其他方式关联数据,如通过URL或仅供同行评审使用的私有链接(出版商的常见问题)。要提高数据共享方式的一致性和实践性,显然还有很多工作要做,但PLOS在部署"可访问数据"图标时采取了包容的态度。只要读者能够访问数据,它就会显示。我们认为更重要的是帮助作为作者的研究人员——他们可能不了解DOI和私人链接的细微差别;同时也帮助作为读者的研究人员在论文中加入不完善但实用的数据链接。