在IOP Publishing上发布的一项研究强调了物理科学研究界在采用开放数据共享方面存在的差异以及他们遇到的各种障碍。
该研究分析了超过30,000篇研究文章,并将研究结果发布在IOPP的白皮书Bringing researchers on board: Navigating the barriers to sharing data publicly中。
环境科学家在共享其研究数据方面最为开放,但与第三方所有权相关的法律限制往往阻碍了他们遵循FAIR原则,即数据应具备可查找性、可访问性、可互操作性和可重用性。物理学家也愿意共享数据,但他们担心所用数据格式的访问性和理解度。工程和材料科学家在共享FAIR数据方面面临最大的障碍是他们担心数据的保密性和敏感性。
关键要点:总体而言,只有10%的物理科学研究人员会在其发表的文章中共享FAIR数据。
环境科学家:超过80%的人员会公开共享研究数据;接近60%的人员遵循FAIR原则。最大障碍是因数据归第三方所有而产生的法律限制。
物理学家:超过70%的人员会公开共享研究数据;只有18%的人员遵循FAIR原则。最大障碍是即使数据可用,其格式也难以访问。
工程科学家:只有55%的人员会公开共享数据;不到8%的人员遵循FAIR原则。最大障碍是没有(已知的)数据库可供提交数据。
材料科学家:超过70%的人员会公开共享数据;不到5%的人员遵循FAIR原则。最大障碍是数据具有保密性或敏感性。
数据的获取能够使研究得以复制,并增强对研究结果的信任。FAIR原则于2016年推出,旨在标准化元数据、分配持久标识符并提供明确的使用许可,从而确保研究数据能够轻松定位、访问、组合和重用,并适当注明出处。
自2022年起,IOPP要求所有作者在文章中包含数据可用性声明,概述支持其研究的数据是否可以访问以及如何访问。2023年,该政策得到扩展,要求无法或不愿公开共享数据的作者解释原因。
该学会出版社支持开放数据实践的其他方式还包括在其期刊中引入创新的内容类型。例如,新的开放获取机器学习期刊系列包括数据集、基准测试和挑战性文章。
IOPP期刊战略与绩效主管兼白皮书首席分析师Daniel Keirs对研究结果评论,“我们发现,即使在物理科学领域,开放数据的障碍也是多种多样。我们需要重新思考几个关键领域,如数据格式的标准化、专有数据问题、数据仓库以及如何激励数据共享。这需要在整个科学生态系统中进行共同努力。”