《具有高社会价值的数据宝藏:使研究数据系统化可访问和可重用》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2020-08-10
  • 德国科学联席会议(Gemeinsame Wissenschaftskonferenz,简称GWK)正在资助“国家研究数据基础设施(National Research Data Infrastructure,简称NFDI)”计划中的三个联盟团体,德国国家科学技术图书馆(German National Library of Science and Technology, Technische Informationsbibliothek,简称TIB)作为共同申请人参与其中。研究数据可提供大量信息,这是科学研究的宝贵资源。为了开发其中的巨大潜力,数据必须是可公开访问和可重用的。这是国家研究数据基础架构计划的目标。

    德国科学联席会议于2020年6月26日决定了将在NFDI第一轮评选中获得资助的联盟团体,TIB–莱布尼兹科学技术信息中心参与了三个被推荐资助的联盟团体:化学联盟(NFDI4Chem),物质与非物质文化遗产研究数据联盟(NFDI4Culture)和国家工程科学研究数据基础结构(NFDI4Ing)。 TIB从一开始就将在塑造NFDI中发挥关键作用。自2020年10月1日起,联盟团体将获得为期五年的资助,并可选择延长五年。

    (1)将各个NFDI计划关联起来

    “NFDI计划旨在为科学和人文科学的所有分支创建一个联合研究数据基础架构。由于TIB已经在开发和运营可供不同专业团体使用的服务,因此我们将特别专注于确保各个计划基础架构的互操作性和互连性。TIB主任Sören Auer博士解释说,语义描述、研究数据与术语和本体的交叉引用和链接、开放研究知识图谱以及永久性标识符和数字保存,都将在此过程中发挥重要作用。

    建立国家研究数据基础设施的目的是确保将来以分散的方式分发的科研数据能够在德国的科学体系中变得可发现、可访问、可互操作且可重用。通过这种方式,研究数据将成为各学科学者可以利用的丰富信息,从而为社会创造附加值。

    (2)使研究数据可系统化访问

    NFDI由GWK在德国科学信息基础设施理事会(German Council for Scientific Information Infrastructures,简称RfII)的建议下发起的。它由德国联邦政府和州政府资助。NFDI的目标是创建遍布全国的动态基础设施和服务网络,以管理德国科学系统生成的研究数据。从一开始,研究人员就将参与开发NFDI。鼓励他们表达自己的需求、想法、愿望和应用场景,并与实施NFDI的基础设施紧密合作。这将确保现有的结构和服务能够更有效地相互链接,并由更多的服务加以补充。

相关报告
  • 《将可访问数据扩展到更多论文、资源库和成果中》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-10-08
    • 2022年3月,在惠康基金会的支持下,PLOS推出了实验性的“可访问数据”功能,旨在促进研究数据的共享和再利用。在得到一些初步成果后,正在扩大"可访问数据"实验范围。 5.1“可访问数据”实验下一阶段要实现的目标 “可访问数据”实验有两个初始目标: (1)提高PLOS论文关联数据集的再利用率; (2)通过在文章上显示提示/奖励,提高资源库的使用率。 在实验的下一阶段,还有一个额外目标:即了解读者在使用不同类型的数据和研究成果时是否存在差异。 为了实现以上目标,PLOS将增加符合条件的论文数量,使关联的资源库和产出类型多样化。在下一阶段,符合以下条件的文章将显示图标: (1)2016年后发表; (2)其数据可用性声明中包含指向资源库中研究成果的链接; (3)链接指向资源库中的唯一记录,资源库包括Dryad、Figshare、Open Science Framework (OSF)、Github、Zenodo、Gene Expression Omnibus、Sequence Read Archive、BioProject 和 Demographic and Health Surveys。 为关联到6个资源库(Github、Zenodo、Gene Expression Omnibus、Sequence Read Archive、BioProject 和 Demographic and Health Surveys)的文章增加图标可以达到两个目的。首先,有资格使用该功能的文章数量增加了三倍,达到15,000余篇,使更多的研究人员获益,提高了促进研究数据和代码发现的能力。其次,增加了不同类型的资源库,从而提高了学习潜力。Dryad、Figshare和OSF是通用型资源库,Gene Expression Omnibus、Sequence Read Archive和BioProject是生命科学领域常用的专业领域资源,而Demographic and Health Surveys则包含社会科学和医学领域的重要资源。以领域为重点的资源库往往对数据和(或)元数据的结构有更具体的要求,PLOS希望了解读者在使用专业领域资源时是否会与使用通用型资源库的内容有所不同。 Github以代码和软件共享、版本管理而闻名,但也经常用于其他内容,包括研究数据。随着代码共享率的提高,以及PLOS大约一半的研究都使用或产生了代码,PLOS希望更好地了解链接到PLOS论文的代码的价值,并支持共享研究成果的关联数据。事实上,所有新添加的资源库在PLOS作者中都很受欢迎——PLOS作者在资源库中共享的成果,约有3/4缴存在以上9个资源库中。这些资源库也与PLOS创建的简单工具相兼容,能够自动创建链接,在某些情况下,还可以"即时"根据入库编号而不是URL创建链接。 5.2 到目前为止的一些统计数据 (1)读者正在使用可访问数据图标 在实验的前12个月(截至2023年3月),共记录了20,000多次读者对图标的点击,在2022年3月首次推出时,该图标显示在3,335篇论文上,在推出后的12个月,又增加了1,200多篇论文。通过分析与PLOS论文关联的543个Figshare数据集,可以发现,在推出该功能之前的12个月中,每月平均浏览量为2.5次,而在推出后的12个月,每月平均浏览量为3.0次(在统计意义上相对增加了20%)。 (2)图标可影响未来的数据共享实践 2019年至今,已发表的PLOS论文作者对资源库的使用率正在上升。但目前还无法衡量"可访问数据"图标是否影响PLOS作者在资源库中的数据共享率,因为实验开展的时间还不够长,无法衡量对已发表论文的影响。不过,研究表明,该图标的可用性可能有助于数据共享的规范化,并影响研究人员选择哪个资源库。 (3)在论文中提供"正确的"数据链接仍然是出版商和作者面临的一项挑战 可访问数据图标鼓励通过网络链接到共享资源库中的数据和代码。最佳实践是通过可链接的持久性标识符(如DOI)进行共享,但许多PLOS论文以其他方式关联数据,如通过URL或仅供同行评审使用的私有链接(出版商的常见问题)。要提高数据共享方式的一致性和实践性,显然还有很多工作要做,但PLOS在部署"可访问数据"图标时采取了包容的态度。只要读者能够访问数据,它就会显示。我们认为更重要的是帮助作为作者的研究人员——他们可能不了解DOI和私人链接的细微差别;同时也帮助作为读者的研究人员在论文中加入不完善但实用的数据链接。
  • 《研究数据管理指南》

    • 来源专题:图书情报
    • 编译者:lixiaoyan
    • 发布时间:2018-12-05
    • 研究数据管理(RDM)已经成为国际上一个非常重要的专业话题,因为学术和政府政策数据的分享发生了变化。由Facet Publishing出版并通过ALA商店发布的“探索研究数据管理”为RDM提供了一个可访问的介绍和指南,其中有些任务能够供读者遵循和发展他们的知识。从探索研究领域以及研究过程中数据的重要性和复杂性开始,作者Andrew Cox和Eddy Verbaan考虑如何创建多专业支持服务,他们研究了在设计不同类型的研究数据服务时需要做出的决策,从本地策略创建和培训到创建数据存储库。覆盖范围包括: (1)讨论RDM的驱动因素和障碍; (2)制度政策并为研究数据服务提供案例; (3)实用数据管理; (4)数据素养和培训研究人员; (5)道德和研究数据服务; (6)从事研究数据服务的案例研究和实用建议。