《Figshare和通用知识库生态系统计划(GREI)已取得良好成效》

  • 来源专题:科技期刊发展智库
  • 编译者: 刘远颖
  • 发布时间:2023-09-15
  •   2022年初,Figshare获准参与美国国立卫生研究院(National Institutes of Health,NIH)通用知识库生态系统计划(Generalist Repository Ecosystem Initiative,GREI)。该计划的目的是向存储库提供资助以增强其功能,更好地满足研究界的数据共享需求,并满足NIH数据存储库的功能需求。

      GREI由NIH数据科学战略办公室(ODSS)资助,汇集了7个通用存储库,旨在改善对共享和发现NIH资助的研究数据的支持。2022年美国白宫科技政策办公室(OSTP)关于公众获取研究的备忘录以及NIH数据管理和共享政策于2023年1月25日生效。

      GREI参与者分别是Figshare、Center for Open Science、Dataverse、Dryad、Mendeley Data、Vivli和Zenodo。各个存储库协同工作,共同努力减少FAIR数据共享原则带来的障碍。

      Figshare在该计划第一年对GREI贡献和完成的一些工作项目如下。

    1.工作成效

    (1)产品改进

      GREI的主要目标之一是改进通用存储库的功能,以进一步支持研究界的数据共享需求。基于此,GREI存储库之间一直在协调努力,以开发通用的、可互操作的标准,供通用存储库使用。同时,每个存储库都会实施单独的产品改进,并引入新功能,以减少通用存储库中数据共享的障碍,同时使数据更容易被发现。

      Figshare做出这些重要改变既是为了满足元数据、用例和可发现性的合作目标,也是为了增强NIH用例的Figshare功能。相关开发工作得到GREI的资助,并且已经开源。

    ①第一年的主要产品改进

      推出一个全新的编辑项目页面,为用户在Figshare.com上创建和编辑项目提供了更好的体验,并鼓励元数据的最佳实践。新页面进一步提高Figshare的可访问性,并为“管理文件区域”和强制性元数据填写提供了全新的界面。新页面标准化了元数据的某些方面,初步测试表明,这一新功能鼓励更完整的元数据和最佳实践的实施。

      这一变化为GREI计划的其他开发奠定了基础,这些开发将致力于实现元数据的合作目标。

    ②添加研究机构的ROR(Research Organiz-ation Registry)永久标识符

      第一年完成了这项工作的第一阶段,ROR PID被添加到机构门户网站的Figshare中。ROR是一项开放的、社区主导的计划,专注于为机构建立永久标识符。实施此标准化提高了Figshare中附属元数据的可发现性和一致性,并支持与其他GREI存储库的互操作性。

    ③改进的检索功能:全文检索和新的默认检索分面

      在Figshare门户上推出PDF全文检索,并计划在未来添加其他文件类型。还添加了新的默认检索分面,包括资助者名称。这意味着只需简单的点击即可按照资助方检索开放数据,而以前的检索用例需要高级检索字符串和用户的大量输入。

      这些新的搜索功能是一个更广泛的项目的一部分。该项目旨在提高搜索能力,使共享的数据更容易被发现,从而鼓励其重用,同时也更容易跟踪其影响力。新的搜索功能现已推出测试版,网址为:figshare.com/search/new。

    2.培训和拓展服务

      GREI一直认为,我们的工作不仅仅要为研究人员改进使用功能,而且需要为共享数据的研究人员以及支持学术机构(例如数据库)数据共享的人员提供资源和培训。鉴于资助者政策和要求(包括NIH的政策和要求)不断提高,这一点尤其重要。

      因此,首要任务是积极与研究界互动,既提供培训,同时收集有关特定群体需求的反馈,为GREI工作提供信息。希望创造新的资源来满足这些需求,并提供培训和公开对话的机会。

      在第一年,Figshare团队开发了一些新资源,并将围绕数据共享最佳实践(特别是针对NIH资助的研究人员)的网络研讨会整合到现有计划中,还为NIH研究所和学术机构的研究人员举办过几次关于NIH数据共享的培训。

      Figshare在创建自己的资源的同时,还与该计划的其他成员就研究界参与计划进行合作。GREI协作网络研讨会取得了成功,就数据共享的最佳实践提供信息丰富的会议和实用建议,并将通用存储库纳入NIH数据管理和共享计划。

    3.协同工作

      GREI将来自7个通用存储库的团队聚集在一起,通过小组委员会就支持GREI总体目标(减少数据共享障碍)的倡议、项目和讨论进行协作。

      在第一年,参与GREI的Figshare团队成员很高兴能够担任领导角色——负责主持学界参与协作工作和主持开放指标协作活动。

      Figshare为GREI用例目录做出了贡献,通过共同努力,确定通用存储库的主要用途,包括数据共享和数据检索。

      Figshare团队还参与了一项合作工作,以评估GREI存储库中使用的当前元数据字段和本体,并确定增加通用元数据和检索功能。这项工作的目标是提高各存储库中数据集的互操作性和可发现性,特别是通过利用常见的DataCite元数据。

      作为 GREI 协作工作的一部分,Figshare重点关注度量指标,与其他存储库合作,利用Make Data Count、DataCite使用跟踪器和引文语料库等工具,确定要实施的度量指标通用标准。

    4.工作展望

      GREI进入第二年,Figshare团队希望通过与其他参与的通用存储库进一步合作,取得更多成果。完成产品改进,这些改进建立在第一年已经完成的增强功能的基础上。

    ①更新相关材料的Figshare“参考文献”元数据,包括与数据集相关的同行评审文章。这允许指定资料标题、URL或PID以及关系类型。此信息随后将包含在DataCite元数据中。

    ②在将ROR加入Figshare机构门户的基础上,未来将在Figshare.com和Figshare+中添加作者级别的ROR。

    ③为了进一步改进检索功能的和体验,同时使共享数据更容易被发现,将添加出版年份和ROR作为分面检索字段。

    ④将支持对文件夹的上传,目的是在数据集中管理文件的结构。

       在整个第二年,将更多地接触NIH资助的研究团队,并充分利用现有的资源库。希望单独或与其他GREI存储库合作,与Figshare一起创建实用的指导材料,以符合NIH 数据管理和共享政策。

相关报告
  • 《管理通用知识库和机构知识库中预印本的十大推荐做法》

    • 来源专题:科技期刊发展智库
    • 编译者:陈诺 杨恒
    • 发布时间:2023-02-28
    •   2022年12月12日,开放获取和知识库联盟(Confederation of Open Access Repository,简称COAR) 和 生物科学和出版促进会(Accelerating Science and Publication in biology,简称ASAPbio)宣布发布“管理通用知识库和机构知识库中预印本的十大推荐做法”。随着预印本共享变得越来越普遍,当前急需一个有凝聚力和可持续发展的生态系统来支持世界各地的研究人员。部分作者会选择将他们的研究成果存放到机构或通用知识库中,但预印本存储面临的问题包括:许多预印本服务器只允许提交英文作品、预印本服务器的长期资助问题悬而未决等,这些问题无疑会阻碍预印本传播的广泛性和持续性。因此,COAR 和ASAPbio的预印本工作组确定了十项推荐的预印本管理实践做法,其中涉及预印本的链接、发现和编辑过程。具体如下: 1.在提交过程中为作者提供一个选项,以提供有关其他预印本、已接受手稿、已发表版本和外部同行评议的信息; 2.当此信息可用时,使用“dc:relation”字段或“isIdenticalTo”、“isVersionOf”、“isPreprintOf”或“hasReview”指示知识库元数据记录中有相关内容,并包含外部资源的 PID; 3.当信息可用时,在预印本登录页面上链接相关版本和外部同行评议; 4.为知识库中预印本的每个新版本分配一个唯一的 PID 并包含一个版本号,该版本号代表其更新顺序; 5.除了版本和评论之外,使作者能够链接到其他相关资源,例如数据、代码或其他相关输出; 6.确保预印本被纳入到领域的预印本发现和索引系统中; 7.在元数据记录和登录页上明确指出该文档是预印本、工作文件或其他特定术语; 8.在预印本的内容页上包含一个文本横幅,告知读者该文档是预印本; 9.在登陆页面或知识库网站上清楚地表明对预印本应用了哪种类型的审核或筛选流程; 10.如果预印本已被删除,请保留元数据和将其状态指定为“撤回”的登陆页面。
  • 《解读欧特克3D打印软件生态系统》

    • 来源专题:数控机床与工业机器人
    • 编译者:杨芳
    • 发布时间:2015-11-04
    • 记者:欧特克推出开源3D打印软件操作平台“Spark”的初衷是什么?   Chris Romes:开源非常重要,因为它的主要目标是推广应用。对于Spark而言,我们希望3D打印业内的主要参与者都能广泛利用这个平台。此外,开源意味着别人都能够对这个平台有所贡献,共同改进在3D打印过程中出现的问题并受益。比方说,市场上可能有数百个3D打印机,但没有必要为每个打印机写出专门驱动程序,而只要通过Spark就能把软件与硬件很好连接起来。   3D打印世界的现实情况是,软件与硬件无法良好对接,缺乏“通用语言”或者说“通用平台”,所以欧特克想建设3D打印的全新生态系统。我们试图解决这些问题,让大家比如硬件、软件生产商、增材制造 商与设计师等都能容易参与并有所贡献。   记者:开源的Spark与之前推动中国3D打印桌面机迅速普及的RepRap能产生的功用有何不同?   Chris Romes:Spark是开源3D打印软件操作系统,而RepRap则主要针对3D打印硬件开源。Adrian Bowyer的RepRap,推动FDM 桌面级3D打印机对消费者与创客实现了大规模与低成本的生产与销售。不过,在桌面机领域目前也存在不少问题。我们针对FDM桌面机进行一项调查,发现约50%的机器卖给了各类教育机构,但由于缺乏教程编排、易操作的软件程序、打印质量等各种原因,这部分打印机中有90%没有被理想地使用,就呆在角落中。而Spark所要做的就是要让整个打印过程变得极其简单容易——找来个模型,按下按纽,开始打印!同时,我认为3D打印的真正价值还是在于工业领域的应用,这也是我们要推进的重点。当然这对于Spark的挑战也会更大与复杂些,它对推动航天、消费电子、机械、建筑乃至电影制作等多个领域的3D打印应用大有用武之地。   记者:Ember在欧特克的3D发展规划中扮演怎样角色?   Chris Romes:Ember是一个参照物,与其它3D打印机其实不存在太多竞争关系。我们可以通过Ember向硬件生产商展示如何与Spark平台融合并有效运作,如同Google 将Nexus手机作为应用Android系统的示范。同时,Ember擅长打印讲求高品质与精度、体积小巧的模型,比如珠宝与牙科应用等,就此也为其它行业进行很好示范。有了开源的软件系统Spark、加上网站公开了Ember的机械设计文件和打印材料化学配方,设计师与研究者可在此技术上进行改进与创新,利用开源平台不断为Ember增添新价值。   记者:Spark推出已经一年,您觉得已经实现初始目标了吗?   Chris Romes:我们取得了相当不错的进展。一批核心的Spark早期应用者与我们签约结为伙伴;大约200来个开发者使用Ember,利用Spark的API发展应用并提供反馈;同时,我们已经非常接近完全公开Spark的所有API。此外,微软宣布将3D打印平台Spark嵌入Windows 10操作系统,HP也将在它们要推出的最新3D打印机中采用Spark。   记者:为什么选择与微软、HP、达索系统、SLM Solutions等创始成立组成3MF 3D打印联盟?   Chris Romes:为了3D打印产业成功前行,形成规模态势,就要在核心技术上取得一致。我们需要“通用语言”,一个统一更易用的文件格式去存储数据、交流应用。就如传统2D打印最初采用的也是PCI等较低文件格式,后来PDF格式开发出来并逐步成为行业标准,让打印对人众都变得简单。这也是我们期望3D打印能实现的。所以我们与微软、HP等几家在3D打印领域规划长远的公司形成联盟,致力解决当下行业缺乏标准等问题。要知道,我们与微软、HP等多年前就形成了良好的合作关系。比如欧特克20年前就与HP在2D打印领域合作,当他们要开发3D打印机软件系统时,首个想到的也是我们。   记者:您如何看待中国大量投资涌入3D打印领域但利润率却不尽如人意状况?欧特克又怎么利用构建开源的3D软件生态系统赚钱?   Chris Romes:3D打印的现实的确是利润率较低,但它拥有广阔发展潜力,可预见整个行业在未来十年将保持每年20%-30%的增长,这也是为什么这么多投资涌入的原因。欧特克投资了开源的软件系统Spark及可与Spark结合、能提供良好打印体验的专业应用等。来到中国,感受到政府对发展3D打印充满兴趣、很多大学开展研究,不少初创型企业诞生。而欧特克的Spark能够让这些3D打印初创型企业的工作变得更简单。   就可应用的客户数量而言,Spark具有极大的市场空间。对于欧特克而言,当硬件公司安装了Spark后,我们所有的专业软件也都可以用于那台打印机,这会加速设计软件的应用,从而让欧特克的软件变得更有价值。   记者:火花投资基金是否在中国找到了合适的投资对象?   Chris Romes:Spark Investment Fund让我们机会去遴选真正的创新技术,激发潜力,与3D打印创新者结成伙伴。目前我们首个已经投资了一家挺有趣的企业Carbon 3D,同时在英国、德国及以色列等3D打印产业发展较好的国家寻找项目。中国已有几家3D打印企业申请了火花基金,我们会密切关注它们的发展。只要是有发展前景的3D打印创新企业或技术,我们对于单个投资项目不设上限。