《CSCD推出科技文献与科学数据关联服务,助力科学数据共享重用》

  • 来源专题:科技期刊发展智库
  • 编译者: 华宁
  • 发布时间:2023-01-28
  •   科技文献和科学数据都是科学研究活动的重要产出形式。构建科技文献与科学数据间的关联关系对国家科技资源的高度融合、提高学术资源利用率、支撑我国科研创新发展至关重要。

      为了推动我国开放科学整体趋势,辅助科研人员对多元科技学术资源的发现和复用,中国科学引文数据库(CSCD)探索实现基于语义内容的科技文献与科学数据关联服务。通过与科学数据银行(ScienceDB)、国家青藏高原科学数据中心(TPDC)、国家对地观测科学数据中心(NODA)、国家地球系统科学数据中心(GEODATA-NSTI)等数据中心合作,CSCD目前已实现地球科学领域部分文献与数据集间的双向互链,相应关联结果可为科研人员提供相关资源推荐和知识发现服务。

      目前,CSCD平台针对地球科学领域科技文献与国家青藏高原科学数据中心科学数据,实现基于文献与数据集间的名词术语和研究主题相关度的关联服务。用户可在检索的文献主页右侧浏览“相关科学数据集”,数据集的推荐顺序根据与被检索文献的研究内容相关度由强到弱依次排列。

      此外,每条关联科学数据提供链接服务,用户可通过点击跳转至科学数据所属科学数据中心的主页界面,便于快速浏览和获取相关数据集。

      为了实现文献数据资源的互通互链,CSCD设计开放专用数据接口,支持科学数据存储平台由科学数据向科技文献的回链服务。目前CSCD已支持ScienceDB、TPDC、NODA、GEODATA-NSTI等平台进行基于关键词、作者等特征的数据集与文献关联识别,以及相关文献推荐服务功能。用户可点击数据集的某篇关联文献链接跳转至CSCD平台并查看文献的详细信息。

相关报告
  • 《开放科学是更好的科学》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-10-23
    • 开放科学运动的核心是坚信开放科学是更好的科学——更严谨、更具包容性、更高效、更值得信赖、更可复制,对社会更有影响力。 开放科学实践的各个方面(从开放方法和数据,到预印本,到ORCID和CRediT,再到开放同行评议)都是相辅相成的循环的一部分。每一个组成部分都相互配合,随着开放科学普及率的提高,效益也会增加,并不断向外扩展,重塑研究体系,最终产生更好的科学。 PLOS的使命是引领这种变革。要实现这一目标,最好的办法就是让研究人员能够大规模地参与基本的开放科学实践,具体做法如下:(1)提供符合研究人员以及公众目标和优先事项的开放科学选项;(2)消除障碍,提升所有研究人员使用开放科学的机会。 PLOS于2003年推出PLOS Biology,帮助证明了开放获取期刊的可行性,并于2009年推出PLOS ONE,让更多研究人员能够实现开放获取。2014年,PLOS首创数据可用性政策重新设定了整个行业的数据共享标准。简化预印本合作方式减轻研究人员的行政负担,使早期共享正常化,并增加了对新科学的获取能力。 为了更好地了解研究人员的需求,激励开放实践以提高研究质量和可靠性,并增加对开放出版选项的访问。PLOS对现阶段的工作进行总结如下: 开放科学指标(OSIs) 为了提高开放科学实践的普及率,我们需要能够可靠地衡量开放科学实践。开放科学指标(OSIs)使用自然语言处理技术识别和量化已发表文献中的开放科学行为,并比较不同学科、地区和其他因素的生成率和使用率从而能够更好地了解和满足研究人员的需求;通过公开数据集,希望也能支持PLOS以外的研究工作。目前,OSI数据集包括数据共享、代码共享和预印本,未来将纳入更多指标。 可获取的数据 读者依靠原始科学数据来理解、验证、复制和再分析,并为未来的调研、系统综述和荟萃分析提供信息。但研究人员只有知道数据的存在,才能获取和使用数据。PLOS的“可访问数据”功能是一项试验性功能,它提高了PLOS论文页面上关联数据的可见度。通过这种方式突出显示可公开获取的数据,促进数据的获取和再利用,节省读者在线搜索公共数据的时间。在第一年取得成功后,"可访问数据"功能最近从最初的三台服务器扩展到九台。 超越文章处理费 文章处理费(Article Processing Charges, APC)证明了开放获取的可行性。但是,APCs也具有排斥性和不公平性;对作者来说负担沉重,对出版商来说管理起来费时费力;而且往往会产生以量取胜的激励机制。PLOS正在超越 APCs,采用新的资助模式,更公平地分配出版成本,减少每个人的支出,包括社区行动出版和机构协议。
  • 《开放科学框架发布新元数据:支持数据共享政策合规性》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-06-14
    • 元数据是开放科学框架(Open Science Framework,OSF)最重要的功能之一。所有OSF的项目、登记项目和预印本都带有元数据,用于记录OSF实例的信息,如标题、描述或关键词。元数据通常对于研究来说是不可或缺的,如果没有标题、描述或关键词,研究就很难被发现,甚至更难理解。 研究人员现在能够添加有关他们在OSF上共享的材料类型信息,以及资金或资助来源信息。随着在线资源数量的激增,不仅在OSF上,此类信息对于组织、发现和重用研究成果至关重要。 这种元数据非常重要,事实上,国际上的主要国家和其他资助、研究支持机构的许多新政策都有所涉及。NIH的新数据共享政策于2023年1月25日生效,要求共享一组通用的数据元素,包括我们最近更新的资助者和资源类型信息。除了这些具体指南外,其他机构也在支持创建更成熟的数据共享基础设施。白宫科技政策办公室最近的政策,以及联合国教科文组织关于开放科学的建议,都设想了一个需要增强元数据作用的研究生态系统。 1 元数据遵循FAIR原则 元数据使研究材料能够被发现、被理解和被重用,并确保数据和其他研究成果是可发现、可访问、可互操作和可重用 (Findable, Accessible, Interoperable, and Reusable, FAIR) 的。 (1)可发现 虽然文本材料支持检索,但其他材料却不容易被找到。元数据是理解和发现这些格式资源的关键。即使存在文本,元数据也会增强和简化这些信息。它可以描述不能立即被观察到的内容,如视频的长度、主题或相关研究领域,或者资助者的名字。 (2)可访问 一旦被发现,研究成果就需要元数据来指出资源的访问方式,以及可能的身份验证和授权方式。有关资源许可、资源语言和任何使用限制的元数据对于共享研究至关重要。 (3)可互操作 元数据使研究成果能够与其他资源和系统集成。在许多情况下,OSF公共内容的索引会自动发生,因为OSF有一个公共API,并向Datacite和Crossref注册持久标识符 (Persistent Identifiers,PIDs)。除了OSF项目、预印本和登记项目的DOI外,OSF还能够利用人(ORCID iDs)、地点(OSF机构成员隶属关系的ROR IDs和资助者的Crossref Funder IDs)和事物(将数据、出版物和资源的DOI与OSF登记项目、预印本进行关联)标识符。OSF内容页面还使用元标记,以便被其他服务(如Google学术搜索和数据集发现、Web of Science和其他工具)获取,以提高研究的可发现性和影响力。 (4)可重用 为了最大限度地增加对研究的资助,元数据能够确保它们可发现、可互操作和可理解,以进一步推进知识发现和创新,从而重用研究成果。元数据可以告诉其他人数据或资源的结构、资源中使用的语言或本体、他们是如何收集或生成的,以及应该如何被读取或使用。如果元数据中没有这些重要信息,研究就只能是一次性的。 OSF推出新的FAIR元数据功能,将使用户能够满足资助者的要求,并添加更多关于研究材料性质的信息,使资助者或合作者更容易找到、访问和利用研究成果。这些变化将使 OSF的可检索数据变得更加丰富,同时也符合新的数据政策。 2 OSF 元数据 元数据已经是OSF的一部分。OSF新推出的元数据增强功能能够使研究生产者和消费者能够以多种关键方式存储和共享元数据,如图1所示。为了进一步增强OSF内容的FAIR属性,目前正在为以下内容添加元数据字段: ●资源类型,描述您共享的研究材料类型(数据集、论文、图像等) ●所用语言 ●资助或支持研究的资助者的姓名 ●具体奖项名称 ●奖项的标识符 由我们现有的标题、描述、贡献者、许可协议、发布/修改日期的元数据作为补充。 此外,目前只能在登记项目和预印本上找到的学科或学科领域将在未来几周内添加到项目中。 另一个主要变化是新的元数据在文件级别可用,如图2所示。例如,虽然您可能想要描述项目或登记项目的总主题或资助者,但您现在可以将有关材料类型或语言的信息添加到特定文件中。这意味着如果您想要专门查找或共享数据集,您可以将该资源类型添加到那些特定文件中。 3 社区元数据工具 作为社区驱动的开源工具,OSF一直努力利用其他社区开发的开放标准和工具。OSF上的元数据旨在支持越来越多的社区开发的元数据模式和本体,已经实现了Datacite的元数据模式。这使得OSF与其他通用资源库保持一致,这也是我们在NIH通用资源库生态系统倡议(Generalist Repository Ecosystem Initiative, GREI)中合作开发一套通用元数据的一部分。OSF继续建立在重要的学术社区基础设施之上,如DOIs、ORCID iDs、ROR IDs、资助者IDs 以及内容和数据发现服务,以使OSF内容从研究计划一直到结果报告都尽可能FAIR化。开放科学中心(Center for Open Science, COS)也直接参与全球元数据工作组和委员会的工作,包括Datacite、Crossref和欧洲开放科学云(European Open Science Cloud, EOSC)。随着时间的推移,更多的元数据模式、本体和标准可以很容易地集成到OSF内容的元数据工作流中。计划纳入CEDAR等工具以支持更多特定领域的元数据,并纳入CREDiT等标准以使研究实践与激励措施保持一致,并希望能与期刊和其他平台合作,在各平台间拉动元数据,以提高研究人员的效率。 未来的元数据工作将包括改进OSF中的搜索和发现、创建具有更多字段的自定义元数据模板以及简化元数据创建工作流程。通过将这些新字段添加到OSF项目、登记项目和文件中,可以满足资助者的要求并提高研究的可发现性。