2022年初,Figshare获准参与美国国立卫生研究院(National Institutes of Health,NIH)通用知识库生态系统计划(Generalist Repository Ecosystem Initiative,GREI)。该计划的目的是向存储库提供资助以增强其功能,更好地满足研究界的数据共享需求,并满足NIH数据存储库的功能需求。
GREI由NIH数据科学战略办公室(ODSS)资助,汇集了7个通用存储库,旨在改善对共享和发现NIH资助的研究数据的支持。2022年美国白宫科技政策办公室(OSTP)关于公众获取研究的备忘录以及NIH数据管理和共享政策于2023年1月25日生效。
GREI参与者分别是Figshare、Center for Open Science、Dataverse、Dryad、Mendeley Data、Vivli和Zenodo。各个存储库协同工作,共同努力减少FAIR数据共享原则带来的障碍。
Figshare在该计划第一年对GREI贡献和完成的一些工作项目如下。
1.工作成效
(1)产品改进
GREI的主要目标之一是改进通用存储库的功能,以进一步支持研究界的数据共享需求。基于此,GREI存储库之间一直在协调努力,以开发通用的、可互操作的标准,供通用存储库使用。同时,每个存储库都会实施单独的产品改进,并引入新功能,以减少通用存储库中数据共享的障碍,同时使数据更容易被发现。
Figshare做出这些重要改变既是为了满足元数据、用例和可发现性的合作目标,也是为了增强NIH用例的Figshare功能。相关开发工作得到GREI的资助,并且已经开源。
①第一年的主要产品改进
推出一个全新的编辑项目页面,为用户在Figshare.com上创建和编辑项目提供了更好的体验,并鼓励元数据的最佳实践。新页面进一步提高Figshare的可访问性,并为“管理文件区域”和强制性元数据填写提供了全新的界面。新页面标准化了元数据的某些方面,初步测试表明,这一新功能鼓励更完整的元数据和最佳实践的实施。
这一变化为GREI计划的其他开发奠定了基础,这些开发将致力于实现元数据的合作目标。
②添加研究机构的ROR(Research Organiz-ation Registry)永久标识符
第一年完成了这项工作的第一阶段,ROR PID被添加到机构门户网站的Figshare中。ROR是一项开放的、社区主导的计划,专注于为机构建立永久标识符。实施此标准化提高了Figshare中附属元数据的可发现性和一致性,并支持与其他GREI存储库的互操作性。
③改进的检索功能:全文检索和新的默认检索分面
在Figshare门户上推出PDF全文检索,并计划在未来添加其他文件类型。还添加了新的默认检索分面,包括资助者名称。这意味着只需简单的点击即可按照资助方检索开放数据,而以前的检索用例需要高级检索字符串和用户的大量输入。
这些新的搜索功能是一个更广泛的项目的一部分。该项目旨在提高搜索能力,使共享的数据更容易被发现,从而鼓励其重用,同时也更容易跟踪其影响力。新的搜索功能现已推出测试版,网址为:figshare.com/search/new。
2.培训和拓展服务
GREI一直认为,我们的工作不仅仅要为研究人员改进使用功能,而且需要为共享数据的研究人员以及支持学术机构(例如数据库)数据共享的人员提供资源和培训。鉴于资助者政策和要求(包括NIH的政策和要求)不断提高,这一点尤其重要。
因此,首要任务是积极与研究界互动,既提供培训,同时收集有关特定群体需求的反馈,为GREI工作提供信息。希望创造新的资源来满足这些需求,并提供培训和公开对话的机会。
在第一年,Figshare团队开发了一些新资源,并将围绕数据共享最佳实践(特别是针对NIH资助的研究人员)的网络研讨会整合到现有计划中,还为NIH研究所和学术机构的研究人员举办过几次关于NIH数据共享的培训。
Figshare在创建自己的资源的同时,还与该计划的其他成员就研究界参与计划进行合作。GREI协作网络研讨会取得了成功,就数据共享的最佳实践提供信息丰富的会议和实用建议,并将通用存储库纳入NIH数据管理和共享计划。
3.协同工作
GREI将来自7个通用存储库的团队聚集在一起,通过小组委员会就支持GREI总体目标(减少数据共享障碍)的倡议、项目和讨论进行协作。
在第一年,参与GREI的Figshare团队成员很高兴能够担任领导角色——负责主持学界参与协作工作和主持开放指标协作活动。
Figshare为GREI用例目录做出了贡献,通过共同努力,确定通用存储库的主要用途,包括数据共享和数据检索。
Figshare团队还参与了一项合作工作,以评估GREI存储库中使用的当前元数据字段和本体,并确定增加通用元数据和检索功能。这项工作的目标是提高各存储库中数据集的互操作性和可发现性,特别是通过利用常见的DataCite元数据。
作为 GREI 协作工作的一部分,Figshare重点关注度量指标,与其他存储库合作,利用Make Data Count、DataCite使用跟踪器和引文语料库等工具,确定要实施的度量指标通用标准。
4.工作展望
GREI进入第二年,Figshare团队希望通过与其他参与的通用存储库进一步合作,取得更多成果。完成产品改进,这些改进建立在第一年已经完成的增强功能的基础上。
①更新相关材料的Figshare“参考文献”元数据,包括与数据集相关的同行评审文章。这允许指定资料标题、URL或PID以及关系类型。此信息随后将包含在DataCite元数据中。
②在将ROR加入Figshare机构门户的基础上,未来将在Figshare.com和Figshare+中添加作者级别的ROR。
③为了进一步改进检索功能的和体验,同时使共享数据更容易被发现,将添加出版年份和ROR作为分面检索字段。
④将支持对文件夹的上传,目的是在数据集中管理文件的结构。
在整个第二年,将更多地接触NIH资助的研究团队,并充分利用现有的资源库。希望单独或与其他GREI存储库合作,与Figshare一起创建实用的指导材料,以符合NIH 数据管理和共享政策。