《学术元数据现状:2023》

  • 来源专题:科技期刊发展智库
  • 编译者: 李涵霄
  • 发布时间:2023-07-14
  •   随着学术交流迅速适应开放科学、技术和文化的巨大变化,元数据和持久性标识符(PIDs)重新受到关注,这些标识符是关于人、地方和对象的必要组成部分,是行业活力的重要组成部分。仅在美国政策层面,利用元数据加速行业转型是尼尔森备忘录和最近来自NIH和交通部的信息请求的共同主题。

      学术研究是复杂且相互关联的,一个领域的变化可能会引发整个生态系统的改善或恶化。举例来说,考虑PIDs在开放获取(OA)资金拨款方面的作用。OA 管理平台依赖于元数据元素,特别是来自上游提交和同行评审系统的组织 PIDs,来自动匹配稿件与潜在资金来源。这通常发生在文章接受时,并且越来越多地发生在提交时,消除了对作者的手动管理,并支持出版商、机构、联盟和资助者大规模实现OA。

      为了对组织ID进行健康检查,我们在2021年审查了我们的科学传播OA工作流平台RightsLink中跨出版商的机构从属和/或资助者数据记录。我们发现,82%的已接受稿件包含了这些数据,这比前几年有所改善。然而,这些统计数据掩盖了一个丑陋的事实:在许多情况下,这些稿件使用机构电子邮件域名作为资助或折扣资格的代理而不是使用PID。在没有PID的18%的稿件中,错过的资助机会会给作者、机构和出版商带来不必要的工作(和费用),以便事后进行调和。

      即使美国版权结算中心(Copyright Clearance Center,CCC)——无论是单独还是与其合作伙伴和出版商合作——能够在稿件接受时关闭这些元数据差距,这也是后期的过程,而PIDs在研究生命周期早期的优势将会丧失。在上游记录系统中解决元数据差距会更有效,这样就不会颠倒大局。这正是我们鼓励NIH将资助申请过程视为早期机会来强制实施PIDs并向支撑研究生命周期的其他系统(例如,当前研究信息系统)进行级联的原因。

      但是从哪里开始呢?PID是一个不稳定的话题,我们需要与那些对ISNI和Ringgold的复杂性不感兴趣的人进行沟通。但如果这些人知道缺乏PID会导致缺乏资金,他们就会关心。为了解决这个问题,我们最近与数十个利益相关者进行了交谈,并通过OA映射了一系列元数据挑战。我们建立在现有工作的基础上,以可视化分散的元数据供应链的连锁反应。结果是一个研究生命周期的交互式报告,旨在让每个人更深入地了解2023年学术元数据的状态。尽管问题很多,但它们并非不可克服,而且存在许多支持变革的基础设施。

      我们与Media Growth Strategies合作,采访了来自机构、出版商、资助者、研究人员、服务提供商、PID提供商和行业协会的代表,以了解整个生态系统中元数据和PID的现状(见图1)。我们问了以下问题:

    ●谁应该创建和维护元数据?它应该起源于哪里?

    ●您投入了哪些资源来创建、管理或维护各种类型的元数据?

    ●当涉及到元数据管理和/或使用PID时,您面临的最大挑战是什么?

    ●最关键的元数据元素是什么?

    ●如果这些元素不能在学术交流中持续存在,那又会有什么危险呢?

    ●谁应该拥有元数据的质量和控制?

      以下是有关元数据断链和复杂性在研究生命周期中造成影响的相关人士的观点:

      研究人员:各方利益相关者普遍认为,研究人员承担着重要的行政负担,以断言或重新断言数据(例如机构隶属、资助者ID),最终干扰和延迟科学发现。

      机构:由于研究生命周期中的元数据不一致性,机构需要采用耗费人力的解决方法手动调解资助资格和APC账单,并将非结构化的数据标准化,以进行综合分析。

      资助者:缺失元数据(例如注册的授予DOI、机构隶属)使资助机构难以链接资助和研究成果,可能导致开放获取的采用率低、问题性的影响跟踪以及不完整的分析,进而影响资助决策。

      出版商:元数据断链干扰业务转型计划,导致高昂的运营和机会成本,并使履行开放获取协议条款和分析交易绩效以便为未来决策提供参考更加复杂。

      许多利益相关者认识到,新的元数据策略、包容性政策和一个强大的互操作系统框架对于现代化学术交流的这一要素至关重要。同时,整个生态系统致力于提高所有团体的数据质量将有助于推动向开放的转变,同时有助于保护研究诚信、扩大可发现性和改善影响度量。如果整个行业共同努力通过重新审视元数据政策和实践来缩小这些差距,利益相关者无疑将感受到更少的痛苦。


相关报告
  • 《关联缺失:期刊关联数据的演变现状》

    • 来源专题:图书情报
    • 编译者:xuxue
    • 发布时间:2019-01-13
    • 关联数据有可能在开放的网络上公开有关序列和序列关系的描述性元数据,并允许有关序列化的图书馆信息与看似无限的网络数据元素之间建立创造性的连接。关联数据也有可能解决一些经典的串行困境,包括最新记录与连续记录的比较,以及印刷版和在线版的单记录与多记录的比较。这些可能性如何与商业和图书馆部门中不断发展的关联数据项目的发展现状以及国会图书馆的书目框架倡议(BIBFRAME)相适应?本文的三个部分将介绍关于关联数据和序列化的不同观点。
  • 《ChemRxiv的5年:现状及今后的发展方向》

    • 来源专题:科技期刊发展智库
    • 编译者:刘敬仪
    • 发布时间:2022-10-19
    •   ChemRxiv于2017年8月15日推出,旨在为化学和相关领域的研究人员提供一个立即分享其最新研究成果的平台。在过去五年中,ChemRxiv已发展成为化学科学的首要预印本服务器,在全球拥有受众和广泛的学术内容,这一现状有助于更快地推进科学发展。在建立5周年之际,ChemRxiv对过去5年进行总结和回顾,并对未来进行展望。   ChemRxiv是五大化学学会的合作伙伴:美国化学学会、日本化学学会、中国化学学会、德国化学学会和英国皇家化学学会。ChemRxiv的29名科学咨询委员会成员由来自17个国家的研究人员组成。   在这些管理组织和倡导者的参与下,ChemRxiv帮助化学界团结、开放发展。   ChemRxiv的共同目标与建立时相同: (1)快速共享初始研究成果,加快关键信息传播效率,并开创新的合作; (2)适当的作者贡献声明; (3)扩展最新研究成果的传播范围; (4)对已完成的研究工作的可见性申请等; (5)提供社区对早期手稿版本进行反馈的机会,从而形成更强大的同行评议文章。   ChemRxiv最近对900多名化学家进行了调查,以了解他们对预印本的更多看法,超过43%的人认为“新研究的首发权”是预印本平台为科研人员带来的一个极其重要的好处,超过87%的人觉得这一好处较为重要。其次是“向社区快速分享结果”,然后是“研究活动的公开记录”。   预印本最令人担忧的是它们可能被用来传播错误信息(在922名受访者中,超过65%的人列出了这一点)。这一结果促使ChemRxiv继续强调平台筛选过程和向外传递信息等相关工作的重要性。虽然平台不采用严格的同行评审从而加快发布过程,但提交给ChemRxiv的每一份预印本都由一名博士级化学家进行审查,以确定该研究具有基本的适当性,并且没有任何有害或明显欺诈的内容。ChemRxiv还在主页进行了标明,告知大众这些内容尚未经过同行评审,不应被视为最终内容。   展望未来:   我们将集中在以下3个方面开展工作: (1)改善使用ChemRxiv的作者和读者的体验,包括提交新的预印本文章和发现新的发布内容; (2)将预印本与更广泛的出版空间进行紧密链接,如通过将预印本链接到已发表期刊文章和ORCID配置文件更好地进行元数据的共享; (3)继续改进网站底层的基础设施,使得我们提升工作效率,使得读者更容易找到所需的预印本。