《新数据集为同行评议提供独特见解——超过2,000种Elsevier期刊将向科研人员提供匿名文献元数据》

  • 来源专题:科技期刊发展智库
  • 编译者: 孟美任
  • 发布时间:2022-10-14
  •   2022年9月,Elsevier的国际研究中心实验室(ICSR Lab)发布了一个重要数据集——Elsevier期刊三年的文献和同行评议数据,其中包含超过500万作者、审稿人和编辑的关联信息。感兴趣的研究人员还可以获取到编辑部决议和评审时间表,包括提交和决议日期,以及作者、编辑和审稿人的元数据。所有数据都存放在虚拟实验室的一个特殊位置,称为同行评议工作台(Peer Review Workbench)。推进所有领域研究评估的发展是ICSR的重要使命之一,而ICSR实验室是履行这一使命的基地。该基于云计算的平台使研究人员能够分析大型结构化数据集,包括支持Elsevier解决方案(如Scopus和PlumX)的数据集。

      Elsevier的同行评议专家体验负责人Mehmani博士表示,该项目有一个非常明确的目标:支持对同行评议的系统研究。与其他研究主题不同,同行评议研究总是较为分散,且往往基于有限的证据,这主要是因为研究人员难以大规模获取文献和同行评议数据。Elsevier会定期收到有关同行评议的研究方案,例如,研究人员希望了解哪种同行评议模型在他们的领域中最有效,或者想从性别角度研究同行评议。Elsevier会尽力支持研究者,但现有的工作流程难以满足这些需求。作为PEERE同行评议工作组成员,Mehmani与ICSR实验室团队联系,提议利用Elsevier文献和同行评议数据补充他们现有的数据集。

      Elsevier科研评估副总裁兼ICSR主席Plume博士表示,以期刊为媒介的文献同行评议通常被认为是专家评审的黄金标准,但缺乏对其全面的研究。通过安全和匿名的方式将这些数据开放,将有助于改进同行评议。此外,我们希望它能为严重依赖专家评审的其他领域提供信息,例如研究评估实践。

    (1) 有哪些可用数据?

      对于此次发布的初始版本,同行评议工作台将包含Elsevier在线稿件提交系统中三年稿件元数据,包括有关编辑部决议、稿件作者和同行评议专家的信息。

      “由于每年向Elsevier期刊提交的稿件数量庞大,” Mehmani说,“我们选择从三年的数据开始,逐年扩充语料库,以提高数据在趋势分析中的效用。所以明年,将有四年的数据可用,依此类推。”虽然只有三年的数据,但至少包括500万人的信息,Elsevier已经对这些信息进行了匿名、汇总和丰富。此外,每个研究小组的访问权限仅限于解决他们自己的研究问题所需的变量和数据子集。

      Elsevier确保无法从数据中识别出任何人。研究人员只能访问该数据集独有的一组ID号。特别删除“异常”案例,例如,可能通过其国家或机构识别出的作者或同行评议专家。此外,制定了相关机制以及明确的研究方案指南,以确保研究遵循道德伦理和统计保密规则。

      同行评议工作台提供了丰富的数据选项,这些选项将根据每个方案的范围进行定制包括:①Scopus作者简介的汇总数据。例如,特定作者群的出版历史数据。②推断性别。性别分配算法可以提供富有洞察力的模式,并在Elsevier的性别报告编制中发挥重要作用。然而,它们也有局限性——在推断非欧洲名字的性别方面效率较低,而且不能反映完整的性别频谱。③PlumXMetrics,可深入了解在线出版物的范围和影响。④SciValTopics,提供了超越期刊界限的研究主题的细粒度视图。⑤联合国可持续发展目标分类,用于标记与可持续性相关的期刊文章。

      研究人员可以查看一份文献有多少位作者,每个共同作者有多少前期出版物,以及这些共同作者中有多少人曾为Elsevier期刊进行过同行评审。对于数据集中的每个同行评审专家,可以查看提交的评审数量或接受的评审邀请数量。此外,研究人员可以参与到扩充数据集,例如,调查反馈或项目资金。

    (2) 研究人员可以进行什么样的分析?

      同行评议工作台数据集可以帮助解决各种潜在的研究问题。例如,将疫情前两年的数据作为基线数据,以在疫情期间开展同行评议的恢复性研究。事实上,Mehmani博士已经使用类似数据集与米兰大学的Squazzoni教授、瓦伦西亚大学的Grimaldo教授合作,以研究COVID封锁措施对全球女性学者的影响。

      Mehmani博士认为研究不同群体中审稿人的表现会非常有趣,这些群体的划分标准可能是国家、职业阶段、学科,甚至是同行评议模型。这将有助于了解同行评议专家的不同特征如何影响同行评议的质量和结果,也有助于期刊了解如何更好地参与和支持不同群体的同行评议。

      Mehmani博士还希望看到研究人员提交有关“研究的重复验证”的研究方案,因为“可重复性非常重要”。此外,还希望收到跟踪早期研究的请求,即研究人员将能够查看到最初始的研究建议,以及相关期刊是否进行了处理以及处理效果。

     (3) 研究人员如何申请?

      Elsevier欢迎研究人员通过ICSR实验室网站提交研究方案。ICSR团队将检查每一项的完整性和真实性,然后再与由四位学者组成的独立委员会共享以供同行评议。他们分别是来自克罗地亚斯皮特大学医学院生物医学与健康研究系和循证医学中心主任、《全球健康杂志》联合主编Ana Maru?i?教授,瓦伦西亚大学工程学院副院长兼副教授,PEERE副主席 Francisco Grimaldo教授,哈佛大学公共卫生学院生物统计学、人口和数据科学教授Francesca Dominici,以及斯坦福大学META研究员、Springer Nature Research Integrity and Peer Review主编Mario Mali?ki博士。

      研究方案被接受后,研究人员将获得相关数据的访问权限。尽管研究在同行评议工作台环境中进行,但研究人员可以导出他们的汇总数据和相关代码。他们还将被鼓励登记他们的研究假设和方法,并将他们项目的每个阶段与最初的研究方案关联起来。为此,预印本服务器SSRN开辟了一条新通道。出版物可以采用多种格式,包括会议报告和论文、工作论文、预印本和同行评议的期刊文章。ICSR实验室网站上提供了完整的数据访问要求列表。

      该项工作开创数据共享的新方法,这是出版商第一次为了研究目的而采取共享文献和同行评议数据。2015~2018年,Elsevier与出版商Wiley、Springer Nature、皇家学会只是汇总了一些同行评议数据供PEERE工作组使用。Mehmani博士认为这个新数据集将有助于了解和改进同行评议,但是仍然有其局限性。学者通常在多家出版商发表文章,评审也是如此。如果其他出版商也能够通过某种方式分享文献和同行评议数据,那么出版商联合起来创建一个单子数据集将是最终愿景。

相关报告
  • 《数据同行评议能否支持研究的完整性》

    • 来源专题:科技期刊发展智库
    • 编译者:刘敬仪
    • 发布时间:2022-10-19
    •   同行评议是学术出版的标准做法,能够维护已发表研究的完整性。   以下是F1000的数据和软件出版主管Rebecca Grant分享的F1000出版模式的核心——基础研究数据的同行评议。   审稿人将对稿件如下内容进行考量,包括稿件与该领域当前文献的关系、方法和作者得出的结论。尽管对论文结论所依据的研究数据的同行评议还不是所有出版机构的标准,但F1000认为它在支持研究完整性、维护开放科学的原则和提高研究结果的可复制性方面具有重要作用。 1、F1000的开放数据共享   F1000的开放数据政策是支持开放研究和科研诚信方法的关键。许多研究人员认为,科学界存在重现性危机,大多数科学家报告说,他们曾经历过无法重现另一位科学家的实验,甚至是他们自己的实验的情况。在公共资源库中分享格式良好、描述清楚的数据,并提供开放的许可证,同时分享重现实验所需的任何软件或代码,是实现可重现性研究的一个基本步骤。这些要求是F1000开放数据政策的基础,对于确保其他人能够审查、复制、重新解释和重用研究至关重要。 2、整合开放的同行评议和开放数据   F1000支持开放的同行评议模式,在文章的初始版本被公开后,审稿人的审理意见及作者的修改回复也将被发布。与许多出版商不同,F1000还鼓励审稿人评估研究的关联数据,并作为同行评议过程的一部分。   为支持平台审稿人评估数据集,F1000开发了新的同行评议指南,使评估标准更加简单明了。在同行评议过程中,F1000要求审稿人考虑这一问题:“所有的结果所依据的源数据都可以得到,以确保充分的可重复性吗?” 此外,F1000的新指南还包括提示审稿人要考虑文章的数据可用性声明及其清晰度,以及描述数据集的元数据及其有用性。该指南旨在帮助审稿人确定其他人是否可以重新使用该数据集并复制该研究。 3、如何实现数据的同行评议   为了使数据得到同行评议,需要向审稿人以及其他希望使用它的人公开这些数据,F1000的编辑团队需确保每个作者都将他们的研究数据存放在一个适当的数据存储库中。作者应向存储库提供元数据,以确保将来访问数据集的任何人都能了解它是如何产生以及由谁产生的。   此外F1000还要求作者申请一个开放的许可证,即署名许可证(CC-BY)或“CC0公共领域贡献” (CC0 public domain dedication,简称CC0),以便其他人能够以最小的限制重新使用数据集。许可证是必要的,以确保其他研究人员可以使用数据来复制实验。F1000明确要求作者分享他们在进行原始实验时使用的代码或软件——这也必须在一个开放的资源库中分享,并应用开放的、OSI(Open Systems Interconnection,开放系统互联)认可的许可证。
  • 《科研人员选择预印本的优点》

    • 来源专题:科技期刊发展智库
    • 编译者:刘敬仪
    • 发布时间:2022-12-29
    •   预印本正在改变科学研究的传播和审查方式。让我们看看为什么预印本是作者绝对应该考虑的一个选项。   研究人员将研究成果以预印本形式发表的优点包括: ●文章地位的尽快确立 ●早期引用 ●提交前更广泛多元的反馈 ●能见度 ●透明度 ●速度   预印本的重要性日益提升。在同行评议期刊上发表文章代表了研究人员科研事业的进步,但从稿件提交到实际发表之间的漫长等待时间确实会阻碍其进步速度,经过多个审稿人的拒绝、重新提交和修改的流程还会延长时间,但同行评议仍然是研究出版周期的重要组成部分。以下是预印本可为研究人员科研事业和科研领域带来优势的关键方式。   预印本可让研究人员在文章发表前确立地位。Crossref可为预印本分配一个数字对象标识符 (DOI)(见图8)。Crossref是一家非营利性信息标准组织,自 1997 年以来一直为在传统在线科学期刊上发表的新文章(部分过刊)分配 DOI。DOI 是一串唯一标识文档的数字、字母和符号,当文档在可靠的学术网站(如在线期刊)上发布或发布时,所有 DOI 都会加盖时间戳,DOI 及其时间戳的组合使得作者在传统在线期刊中确立其作品的首要地位。 图8 Research Square上的预印本DOI示例 图片来源:https://images.prismic.io/researchsquare/ca53fde6-6281-4127-a30f-d6ddd44a469d_DOI+Example.png?auto=compress,format   Crossref 于 2016 年开始将 DOI 分配给预印本。此后,研究人员将预印本发布到 Crossref 注册的预印本服务器上就可确立其工作的首要地位。在大多数情况下,预印本会在筛选过程后的一到三个工作日内发布到网络平台,甚至可以在同行评议之前发布。大多数预印本服务器会在预印本发布之前对其进行筛选,例如Research Square编辑团队筛选预印本的标准是“符合道德和同意声明;披露竞争利益;没有患者标识;没有不恰当、令人震惊、极具争议或伪科学的主张。”   预印本可在同行评议前促进协作和反馈。在传统出版流程中,提交的稿件在发表前会收到2到3位同行评议专家的反馈。采用预印本发布可使得其他研究人员更快发现最新研究成果,并指出关键缺陷或错误,提出新的研究或数据,以此强化现有论点甚至进行合作。以上行为都可能提升文章质量,使其在更有声望的期刊上发表。同时,反馈可以通过评论公开提供,也可以通过电子邮件私下提供。一位科学家表示,通过发布预印本,其作品提前了10 个月被公开共享,并在短短 2 个月内浏览量超过 1,500 次,“我鼓励所有的研究人员不要再担心,相信预印本,提交手稿,同时阅读预印本并发表评论。”   预印本可提高可见性和透明度,揭露行为不端者。预印本服务器使得研究成果全开放、可发现和可获取,基本上使用互联网的人都可以查看。因此,预印本服务器是揭露行为不端者的绝佳场所,例如抄袭者以及掠夺性出版商。在传统的同行评议期刊中,研究人员以私下提交方式将稿件发给期刊进行同行评议,若通过初步筛选则会被发送给同领域的同行评议专家进行审查,判断稿件是否可以发表以及提出退修意见。稿件若被接受著作权将属于文章作者;若被拒绝,期刊退稿后多数作者会选择其他期刊再次投稿。但是,如果审稿人在同行评议过程中抄袭论文或窃取论文数据以谋取私利怎么办?在封闭的同行评议和出版流程掩护下,行为不端者更容易逃脱。此外,预印本在揭露印刷厂和掠夺性期刊不端行为中也可发挥作用。 编译:刘敬仪、陈诺