CHORUS发布基于论坛得到的关于改进学术出版元数据的启示。CHORUS论坛于2022年9月29日召开,100多名与会者围绕改善学术出版元数据的解决方案进行了热烈的讨论。该论坛得到了美国计算机协会(Association for Computing Machinery), 科睿唯安(Clarivate),美国化学会( American Chemical Society), AIP出版集团(AIP Publishing), 地球科学世界出版社(GeoScienceWorld)和国际科学技术和医学出版商协会(STM)的赞助。
CHORUS执行董事Howard Ratner主持了第一场会议,该会议审查了学术出版元数据中的薄弱环节,以及学术界合作改进元数据的重要性。
美国国家标准与技术研究所(NIST)数据馆员Andrea Medina Smith专注于元数据领域的进展——他承认CHORUS已经取得了很大进展,但也说明了CHORUS仍需在很大程度上改进和缩小差距。NIST的独特之处在于,他们以出版商、资助者和图书馆等多重角色服务于科研人员,因此他们需要从各种角度进行跟踪研究。NIST希望能够随时追踪展示研究人员展示的研究成果,只有通过收集准确的元数据才能实现这一目标。以阅读和出版协议为例,Optica出版集团内容技术架构师Alexander‘Sasha’Schwarzman指出了他在学术出版元数据中看到的一个弱点——作者(个人或团体)。
作者的标记很重要,因为这有助于判定谁符合阅读和出版协议的要求。是只有相应的作者还是有多个作者符合条件,这些在元数据中是如何体现的?目前还没有最佳做法或建议。如果这一条件是基于贡献者类型,则可以使用CRediT分类法。然而,如果条件是基于贡献水平,则当前不存在分类或建议。从属关系、许可和资金是跟踪阅读和出版协议的其他重要元数据元素,也面临着同样的挑战——目前的学术生态系统中缺乏共识或最佳实践。
元数据保留和保存是由图书馆、资助者和出版商监管的另外两个领域,它们将受益于列出的规则和最佳实践。Sasha还重申了FAIR原则(可查找性、可访问性、互操作性、可重用性)和构建社区范围的元数据验证工具的必要性。
本次会议的第三位发言人是Megan O'Donnell,他是爱荷华州立大学图书馆研究数据服务部负责人。他谈到了可操作发布元数据的差距,不仅仅是描述性元数据。随着学术生态系统中元数据的多样化,图书馆承担着使这些元数据在系统中协同工作的责任,以便它们能够更好地被发现。
他指出,通常,机构存储库中的元数据是原创作品。但如果没有指定的DOI,它们将被排除在丰富的学术数据环境之外,也无法被跟踪。他还指出,ORCID ID确实很有用,但ORCID ID是可选择性的,没有与图书馆系统很好地集成——ORCID ID依赖于作者创建、维护和链接到图书馆系统中的记录。图书馆正在致力于将ORCID ID更好地集成到系统中,但还需要做更多的工作。
Megan还指出,目前出版商和存储库之间的协调很少,她从个人经验出发总结了差距:
●更多的标准和标准化
●元数据验证(谁验证和如何验证)
●出版后的更新和进一步丰富
●数据和文本发布者之间的交流
●学术出版物元数据的目标和伦理