《 LIBER链接开放数据工作组发布了“图书馆链接开放数据(LOD)出版的最佳实践”》

  • 来源专题:图书情报
  • 编译者: luoluo
  • 发布时间:2021-04-11
  • LIBER链接开放数据工作组的原始任务说明是为希望以链接格式打开其数据的图书馆提供指南和最佳实践。该工作组基于对图书馆链接数据项目的调查,并在LIBER 2020年会期间的研讨会上进一步完善后发布了“图书馆链接开放数据(LOD)出版的最佳实践”。
    特别是,有许多不同类型的数据库,并且有许多不同的方法来生成链接的开放数据。该指南的思想不是提供严格的技术手册,而是采取更通用的方法,提出在发布链接的开放数据时需要考虑的各种注意事项。因此,该指南努力充当规划链接开放数据发布项目的入门,并通过将过程分为六个步骤并依次讨论每个步骤来进行操作。它还充当跳板,可根据任何特定项目的需要更深入地研究每个步骤的细节。
    开放数据允许其他人使用它,这也可以通过丰富数据的形式或简单地将其作为新的合作机会而使数据的创建者受益。使开放数据尽可能有用的一个关键概念是语义互操作性-两个系统交换数据的能力,而数据的含义保持不变。为了简化此过程,顾名思义,链接数据范式以一种使语义明确甚至机器可处理的方式链接数据。

相关报告
  • 《PLOS发布探索开放科学指标的首个数据集》

    • 来源专题:科技期刊发展智库
    • 编译者:刘晶晶
    • 发布时间:2023-01-28
    •   PLOS根据FAIR原则制定了一个衡量开放科学实践的框架,并与DataSeer合作开发了一套与已发表研究文章中可观察到的特定开放科学特征和行为相关联的数值“指标”。2022年12月12日,第一个数据集可以在Figshare上下载。该数据集专注于三个开放科学实践:数据共享、代码共享和预印本发布。 ●开放科学指标和数据集建立的背景   开放科学正在崛起。这可以从开放获取出版选项的扩展中推断出这一点;bioRxiv发文量稳步上升;新的国家、机构或资助者的政策不断推出等。   但我们对开放科学实践的日常现实究竟了解多少?标准是什么?它们在不同的研究领域和地区有什么不同?开放科学实践是否会随着时间而改变?下一个机会在哪里?采用开放科学的障碍在哪里?   为了开始探索这些问题和其他类似的问题,需要就如何定义和衡量开放科学实践达成共识。此外,还需要了解当前开放科学的采用状态,以便随着时间的推移跟踪进展。这就是开放科学指标项目的切入点。 ●如何使用此数据集?   开放科学指标是一种工具,对研究交流中的许多不同情况和问题具有广泛的潜在应用。这些指标可以补充和支持教科文组织开放科学监测框架工作组的目标,并满足希望更好地了解开放科学实践的组织的需求。它们还可以用于评估政策变化的影响,就像最近的OSTP备忘录中所述的那样,在整个文献中,或者在未来,通过研究学科或主题、机构、地区或时间段进行分析。它们可以告诉我们哪些基础设施最常被使用,以及被谁使用。   PLOS希望更好地理解开放科学工具和实践在今天是如何应用的,可以帮助我们识别障碍,理解社区规范,更好地支持最佳实践,并随着时间的推移跟踪变化。   重要的是,我们的目的不是让这些指标被用作对期刊、作者或机构进行排名的工具。对于研究特征的每一项定量评估,都需要衡量其背景和多样性,来保证这些指标被负责任地使用(例如,The Metric Tide and Leiden Manifesto)。因此,我们认为,这些指标最好用作改进工具。 ●这仅仅是个开始   在未来,我们计划用新的数据点、额外的出版年份和与开放科学实践的其他方面相关的新指标来扩展这个数据集。我们感谢您的反馈,以帮助告知未来的迭代。我们需要知道您对收集的数据字段、我们的开放科学指标定义、确定的开放实践以及我们如何在这第一次结果共享中衡量它们的看法。 ●初步观察   在初始数据集中,我们主要分析了来自PLOS发表的论文和其他一些科学文献中的数据共享和代码共享行为。该数据集还包括对预印本发布的观察。   数据涵盖了PLOS在2019年1月至2022年6月期间发表的约61000篇论文,以及来自PubMed Central的6000篇公开研究论文的比较样本(占PLOS论文样本的10%)。   值得注意的是,此数据集仅测量机器可检测的特征。例如,如果一篇文章的作者共享了一个数据集但没有这样标记,则该数据可能不会被标记为“共享”。数据共享的准确率范围从比较样本的81%到PLOS论文的85%。对于代码共享,准确率范围从比较样本的94%到PLOS论文的97%。比较样本的预印本准确率为96%,PLOS论文为94%。我们的目标是使所有指标和内容来源的准确率至少达到85%。要使开放科学指标大规模发挥作用,必须使流程自动化并将这项工作与其他研究人员的工作进行比较,PLOS正在与DataSeer合作以提高这些准确率,这将在每次数据发布时报告。 ●数据存储库使用   虽然共享数据的方式有很多种,但最佳做法是,将其存放在专门构建的数据存储库中。数据存储库提供的好处包括提升数据的可发现性和元数据、稳定的唯一标识符,以及随着时间的推移保持记录完整性。   开放科学指标数据集提供了两种不同的数据共享方法视图: 1.经认证的数据存储库:数据存储在“已知存储库”中,据保守估计,该存储库基于约130个存储库的受控列表。 2.在线可访问:数据可在可识别的URL上获得。这是一个不太保守的数字,其中包括不常用的存储库、机构存储库,以及其他共享数据的在线方法(例如共享文档、实验室网站等)。   通过任何一种衡量标准,PLOS论文比其他地方发表的同类论文更有可能链接到相关的公共数据集。随着时间的推移,PLOS和比较样本中的论文更有可能在确认存储库使用方面呈现积极趋势。 ●代码共享   PLOS论文和比较样本中的论文之间的代码共享率通常接近。总体而言,任何形式的代码共享都没有数据共享那么普遍,部分原因可能是相关性降低(大多数研究成果会生成数据集,但只有一些研究成果被生成代码)。   除了代码共享率之外,该数据集还追踪了代码是否作为研究成果的一部分,从而为采用率和未来潜在采用提供新的见解。PLOS的目标是在以后的文章中更全面地探索这些数据。 ●预印本发布   数据表明,与其他地方发表的同类文章相比,PLOS论文更有可能拥有相关的预印本。总体而言,21%的PLOS 论文有相关的预印本,而对比数据中这一比例为 19%。 ●“开放科学指标”的下一步是什么?   上述内容探讨了三个指标,但还有许多其他方法可以分析数据集来了解开放科学实践。例如,我们可以深入研究数据和代码共享方法,区分作为支持信息 (SI) 或在存储库中的共享。 图 2 PLOS 和比较样本在数据共享、代码共享、预印本发布方面的论文对比情况 图 3 PLOS 和比较样本中的论文在支持信息之外的数据共享逐年变化图 图4 PLOS和比较样本中的论文在代码共享率的对比情况图 ................................................................................................................................................................................................ *所有数据截至2022年6月30日(上半年末);所有比率均按所有分析文章的百分比计算。
  • 《LIBER和ADBU发布关于研究型图书馆内开放科学服务的联合报告》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2023-07-11
    • 研究目的 欧洲的许多研究图书馆在研究数据管理(RDM)和开放获取(OA)领域提供开放科学服务。然而,约有多达一半的欧洲研究图书馆在这些领域仅提供有限的服务。这项LIBER/ADBU研究的重点是了解这些服务所需的组织结构和能力,以支持整个欧洲的研究图书馆通过本研究的工具包加速采用以上两项开放科学服务。 科技资源开放共享的浪潮正在改变我们获取和传播科研信息的方式。在这一背景下,变革期刊(Transformative Journals, TJ)模型被设计出来,以帮助订阅型出版商成功过渡到全面并即时的开放获取(Open Access,OA)。近日,cOAlition S发布了关于2022年变革期刊进展的数据报告,这是一次深入理解模型运作情况的机会。 研究方法 本研究采访了在这些领域拥有发达和/或先进支持服务的图书馆。基于这些访谈,报告描述了RDM服务的四个发展阶段及其所需的相关组织结构和能力、OA服务的三个发展阶段。RDM支持服务图书馆旨在为研究人员提供涵盖整个数据生命周期的RDM支持服务和基础设施。数据生命周期由三个阶段组成:(1)研究项目的准备以及数据管理计划(DMP);(2)使用所谓的“活动数据”执行研究;(3)发布/归档结果数据集的最后阶段。为了创建在整个数据生命周期支持研究人员的服务组合,图书馆与其他内部利益相关者(例如IT部门、研究办公室、数据保护官员、道德委员会和技术转让办公室)之间需要协作。图书馆的一个重要作用是连接和协调这些利益相关者的活动,并为研究人员提供RDM支持服务。 具体来说可分为四个发展阶段: ?初始阶段:研究资助组织越来越多地要求为其资助的研究项目制定数据管理计划(DMP)。这促使许多研究图书馆开始开发DMP支持服务。该服务通常与现有数据存储库和数据档案的转介服务相辅相成——与其他传统转介服务一致。因此,大多数图书馆RDM服务的起止时间与数据生命周期一致。 ?发展阶段:该阶段服务覆盖数据全生命周期。用于存储和共享活动数据的基础设施、培训和咨询服务通常由IT部门与图书馆合作提供。归档和发布支持服务主要包含用于发布和归档数据集的机构数据存储库(或国家存储库中的机构空间)。这一阶段的图书馆服务是普适性的,并不区分学科。 ?成熟阶段:在此阶段,咨询服务更加专业化。这需要在院系/研究部门中配备数据管理员。规模较大的研究机构促使RDM服务发展出多级组织服务结构。与此同时,图书馆也经常聘请“社区经理”来促进协作和知识交流。 ?高级阶段:此高级阶段的服务可以包括:(1)为执行操作任务的研究项目团队提供“借用”数据管理器;(2)机构研究人员对存档/发布的数据集进行监控;(3)开发围绕研究软件服务。 其中涵盖了六种工作类别:通用数据管理员或数据图书馆员、嵌入式数据管理员、数据经理、教育者/培训师(主要是数据图书馆员/数据管理员的任务的一部分,有时是一个单独的职位)、数据管理员(用于管理数据集) 存放在数据存储库中)和社区经理。 在 “RDM 支持服务“的开发过程中,可以观察到两条断层线(fault lines): ?组织结构:“RDM支持服务”从发展阶段向成熟阶段的转变,一般表现为以图书馆为中心的服务组织向一线/二线组织结构的分布式模式转变。第一线服务的数据管理员(嵌入研究部门或院系)有时由图书馆雇用,有时由院系雇用。 ?能力:“RDM支持服务”在初始和发展阶段所需的能力通常可以由传统图书馆员来满足,他们可以在工作中学习额外的、与学科无关的能力;对于处于成熟阶段的面向学科的“RDM支持服务”则通常需要不同的能力。因此,嵌入式数据管理员、高级阶段的数据管理员这两个职位往往会聘请具有特定学科研究背景的人员,原因在于他们需要具备研究数据管理的操作能力。OA服务OA服务总体目的是提供一条通往开放获取的多路,以避免单一开放获取路线的主导地位:目前,开放获取的主要驱动力是资源库中作者被接受稿件的绿色OA,黄金OA期刊中的APC付费文章,以及图书馆和出版商之间的阅读与出版协议所产生的混合期刊中的开放获取文章。人们普遍担心黄金和混合OA成本的增加,导致最近钻石级开放获取期刊的发展。在所有途径中,图书馆都发挥着至关重要的作用。 可以观察到三个发展阶段: ?初始阶段:OA服务的初始阶段包括与存储库相关的服务以及有关OA的一般教育和培训。大多数欧洲研究图书馆都运营一个存储库,并设有适当的工作流程来支持和刺激研究成果的存放,例如存储库中的绿色OA文章。该存储库可以是机构存储库,也可以是国家存储库,例如法国的HAL。 ?发展阶段:在此阶段,主要的附加服务是支持研究人员选择 OA 期刊,并在黄金期刊(通过用 OA 基金补偿 APC)或混合期刊(通过阅读和发布合同)中发表开放获取文章。 ?高级阶段:在此阶段,图书馆通过提供具有技术支持的OA期刊平台或为期刊和/或专着开发全方位服务的大学出版社来提供机构Diamond OA出版服务。作为开放教育资源的一部分,其中一些Diamond OA出版社也开始出版开放教科书。 可以区分五种工作类别:数字奖学金图书馆员/前台职能的其他图书馆员、CRIS 和/或存储库经理、开放获取基金经理、阅读和出版许可证经理、Diamond OA 出版商。 关于服务所需的组织结构和能力,有两点很重要: (1)组织结构:与已开发的RDM支持服务相比,中央组织模型似乎最适合大多数OA服务,即使处于高级阶段。 (2)能力:Diamond OA出版商的能力似乎存在断层。虽然其他工作类别由图书馆员完成,但对于Diamond OA出版服务,许多图书馆雇用具有出版背景的人员。其他利益相关者眼中图书馆的附加值来自机构内利益相关者以及(国际)国家利益相关者的受访者认为研究图书馆在OA和RDM支持服务方面的附加值有两个方面: (1)中介功能:图书馆基于对研究背景和研究人员工作环境的理解,一方面协调和连接研究人员与其他内部利益相关者之间的中介 (2)与开放科学服务相关的具体能力,例如:全面了解机构和研究资助者在开放科学、开放获取、公平研究数据、研究诚信、道德等方面的监管和政策环境等等;数字出版方面的元数据标准、本体、许可证、版权、标识符和长期保存方面的技术专长;图书馆确实已经支持出版物形式的研究成果,这使它们成为支持研究数据集形式的研究成果的合适方。开放科学的其他方面本研究重点关注OA和RDM支持服务。然而,开放科学的其他方面与研究诚信、研究评估和参与性研究(公民科学)有关。一些拥有先进OA和RDM服务的图书馆已经建立了组织结构来发挥协调和连接作用,旨在在整个机构内促进最广泛意义上的开放科学。 内容编译来自GoOA头条 原文来自:https://libereurope.eu/wp-content/uploads/Open-Science-services-by-Research-Libraries-organisational-perspectives.pdf