开放科学将使研究更加透明和包容,加速知识的进步,此为全球共识。然而,开放科学的愿景依赖于一个强大的、运行良好的知识库网络。这些知识库不仅收集、保存并提供对数百万宝贵研究成果的访问,而且作为关键性的机构资产发挥着作用。在人工智能重塑研究和知识发现的时代,知识库作为机构智力产出的精选馆藏,在确保研究成果的可见性、完整性和可信度方面扮演着关键的战略角色。
机构和学科知识库代表着对知识基础设施的长期投资,它们强化了机构和研究界对开放科学的承诺,同时守护着其研究遗产。认识到这一点,开放获取知识库联盟(COAR)、欧洲开放获取基础设施(OpenAIRE)、欧洲研究图书馆协会(LIBER)和欧洲学术出版与学术资源联盟(SPARC Europe)于2024年秋季联合开展了一项社区咨询,旨在使知识库在不断演变的开放科学生态中占据更有利的位置。此次咨询的结果形成了四个极具说服力的观点,阐述了知识库在欧洲日益增长的战略价值。
(1)知识库促进影响力
“起初,研究和教学人员不愿将他们的成果存入知识库,但现在,他们希望自己做的所有工作都被收录其中,因为他们已经看到了成果入库带来的影响力。”
开放知识库是欧洲数字研究基础设施的基础要素,因为它们免费提供并易于传播出版物、研究数据以及各种其他类型的研究成果。它们对于最大化研究的影响力和传播范围不可或缺,使研究能够超越所谓的“象牙塔”,供从业者、产业界和公众使用和应用。为实现欧洲研究的长期可重用性,知识库应用FAIR(可发现、可访问、可互操作、可重用)原则,并积极进行内容管理,使资源能够被其他系统重新利用,为新的发现、研究评估和研究主张的验证做出贡献。
(2)知识库推动包容性
“我的一位非学术界的同事,被诊断出患有罕见疾病且治疗方案复杂,他通过在知识库中找到某位医生的科学出版物,成功找到了国内为数不多能够实施和监督其治疗的医生之一。”
欧洲的知识库向任何希望使用其馆藏的人提供开放获取,显著改善了当前许多内容仍被付费墙阻隔或仅存于研究人员个人存储的状况。知识库既不收取出版费,也不收取访问费,它们通过让作者可以在他们希望的地方发表成果,同时仍能将其内容开放给包括公众在内的许多其他群体,在支持学术自由方面发挥着关键作用。
(3)知识库保障可信度
“在我们的知识库中,有多个案例显示原始数字文档丢失,而知识库中的副本成为唯一留存。这包括:一个丢失了服务器的机构科学期刊、一位因个人电脑故障丢失了课堂摄影资料的教师以及一些在网络上已不复存在的机构记忆。”
知识库是非商业性的、由学术界主导的基础设施,其用户群体信任它们能够妥善维护和保存所收集的内容。由图书馆、大学或研究中心管理和资助,知识库的使命与学术和教育的价值观一致,而非受营利动机或其他片面视角驱动。为守护学术知识以惠及子孙后代,知识库采用适当的安全和保存实践,确保其馆藏免受网络事件、技术退化及技术变革的影响。
(4)知识库驱动创新
“在钻石出版生态系统中,知识库作为‘出版、评审、策展’(PRC)模型的一部分,履行着‘出版’功能。该模型有望改变学术出版,使其更高效、更具成本效益和透明度。”
在整个生态系统中,知识库确立了自身作为学术内容关键枢纽的地位,它们采用通用标准和技术,确保人类和机器都能无缝访问。通过充当生成式AI、新型出版模式及其他创新服务的公共接口,知识库包含科学出版物等基本资源,这些资源如同为科学量身定制的基础“养料”,滋养着新的创新。这些新型服务能够利用知识库的馆藏,推动创建特定领域和通用型应用程序,从而促进科学发现和创新。
(5)机构领导者必须立即行动,以保障研究的未来
知识库不仅仅是成本中心,它是提升声誉、加速知识共享并增强长期研究影响力的战略资产。在开放科学和AI驱动发现的时代,知识库作为机构和学科知识基础设施的基石,确保研究保持可访问、可信赖和可重用。
为最大化其价值,机构和学术界必须认识到知识库是一项战略性、长期性的投资,并采取果断行动使其面向未来。这意味着要超越最低限度合规的要求,将知识库嵌入研究战略、开放获取政策和数字化转型计划的核心。对知识库的投资,将确保机构在快速发展的格局中始终处于科研卓越与相关性的前沿。
加入OpenAIRE、LIBER、SPARC Europe和COAR,共同进行转型,构建面向未来的研究基础设施,确保机构知识库发展成为动态的、支持AI的、可互操作的枢纽,赋能开放科学,驱动科研卓越,并为子后代确保研究成果的长期可访问性和影响力。
(6)IMPACT-REPO:面向未来的研究知识库
构建有韧性、可互操作、支持AI的研究知识基础设施的七大支柱,具体行动如下:
1)与学术传播和研究系统互操作
·采用开放标准、持久标识符和API驱动的集成;
·通过使用标准化元数据和其他持久标识符,确保知识库符合FAIR(可发现、可访问、可互操作、可重用)原则;
·实现与机构研究信息系统(CRIS)、资助机构数据库和学术出版平台的无缝数据交换。
2)拥有可持续的资金支持和充足的人员配备
·确保获得长期投资以维护、扩展和增强知识库;
·将知识库视为关键的研究基础设施,确保其拥有专门的机构预算和可持续的资助模式;
·利用国家和欧洲的资助机会支持知识库发展。
3)由支持AI的基础设施驱动
·构建面向AI驱动的研究、发现和自动化的元数据结构和知识库;
·采用机器可读元数据、关联数据实践和文本/数据挖掘能力,确保知识库资源在AI驱动的研究生态系统中保持可访问性和价值。
4)与机构研究政策保持一致
·确保知识库成为研究政策和资助战略不可或缺的核心组成部分;
·不要将知识库视为孤立服务,而应将其视为机构更广泛的开放科学和研究影响力议程的关键组成部分;
·将知识库管理纳入机构数据政策、资金分配和战略规划。
5)连接国家和国际知识库网络
·加强国家、区域和国际协作;
·积极参与知识库网络和全球倡议,以提升知名度、分享最佳实践并与不断发展的开放科学政策保持一致;
·倡导将知识库纳入国家和欧盟范围内的研究基础设施。
6)配备确保知识库卓越性的专业人才
·投资于知识库管理和AI驱动研究所需的人员培训与技能提升;
·确保知识库管理者和图书馆员持续接受元数据策展、研究数据管理和新兴AI应用方面的培训;
·建立专业发展计划并参与国际能力建设倡议。
7)抵御网络威胁和技术变革的韧性安全
·实施强大的数字保存和安全措施;
·保护研究成果免受网络事件、数据丢失和技术过时的威胁;
·确保定期备份、基础设施监控,并遵守长期数据完整性和保护的最佳实践。