《Science Navigator 对话式文献知识库正式发布!AI for Science基础设施建设再添基石》

  • 来源专题:数智化图书情报
  • 编译者: 黄雨馨
  • 发布时间:2023-06-17
  • 作为科研工作者,文献的阅读在日常工作中是不可或缺的重要部分,据美国国家科学基金会统计,科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%。从最传统的查阅式检索,到后来基于搜索引擎的搜索式检索,再到现在GPT问答式检索,亟需更好用的工具。5月30日,由科技部主办,中国科学技术信息研究所、北京科学智能研究院、北京智源人工智能研究院联合承办的 “2023中关村论坛-人工智能驱动的科学研究”平行论坛顺利举办。在本场论坛上,北京科学智能研究院、中国科学院计算机网络信息中心、墨奇科技联合发布了一款对话式的文献知识库 Science Navigator,大大提升文献的检索、阅读、分析及管理效率,进一步助力科研人员提升科研生产力,让科研工作者释放更多的时间精力在解决关键问题与创新思考上,此成果的发布也为AI for Science基础设施建设再添基石。中国科学院院士、北京科学智能研究院院长、北京大学国际机器学习研究中心主任鄂维南在论坛中强调,“推动科学研究从“作坊模式”向“平台模式”转变,需要集中力量解决共性问题,构建 AI for Science 创新基座,在科研范式大变革中,这些是推动 AI for Science 发展的关键及核心。”文献是支撑各学科科研工作者研究决策的知识体系与宝库,为提升创新效能,有机地将科学家们的集体智慧充分提取出来,构建易用性强、准确率高的文献的数据库与知识库,是AI for Science发展的基础设施底座之一。科学文献大多为非结构化数据,且专业属性极强,各个领域的文献呈现爆炸式增长,更新速度快。即使大语言模型(LLM)技术的兴起深刻影响着众多行业领域,科研场景也不例外,但大语言模型本身仍存在着不可解释性、对于较为细分的领域知识难以快速覆盖等问题。墨奇科技自研的向量数据库与大语言模型的二者优势融合,就极大程度上克服了这些缺陷。已有实验证明,我们能够为大模型提供比较有力的事实支撑的情况下,它能解决幻觉和数据滞后的问题,但有效的事实支撑又依赖于比较长的文本或者是Token的输入,所以如何在缓存这一阶段解决大语言模型的限制就成了关键,引入向量数据库就是在为大模型提供有效的记忆载体。Science Navigator用更低的计算成本,通过对百万篇文献进行向量化,并在向量数据库中存储和建立索引,实现高效的语义搜索和相似度计算,结合LLM的任务泛化及生成能力,让科研工作者能够通过对话式交互,以提问的聊天形式,更快速便捷、更专业精准、个性化地从领域内海量的文献中获得自己需要的知识与信息。相较于传统检索方法只能返回精确匹配的文献本身,Science Navigator可实现多模态交互。且该文献知识库覆盖了多个学科,如物理学、化学、材料科学、计算机科学等,已收录了百万篇高质量的科学文献,为科研人员提供了一个强大的知识信息资源和智能助手,轻松进行查找、阅读、对比分析、总结等需求,并同时支持中英文提问回答方式,未来还将拓展至生命科学、人文学科等更多领域千万篇高质量文献。Science Navigator 中墨奇数据库在向量计算上表现优异,10万篇论文载入时间30min,向量查询时延可低至25ms,且数据的运算成本以 10 倍计降低。同时 Science Navigator 中构建的实验方法知识库,利用大语言模型和向量数据库技术,从海量的科学文献中自动抽取、整理、归纳和表示实验方法的相关信息,包括实验目的、原理、步骤、参数、结果、评价等,实现对实验方法的快速检索、比较、优化和推荐,以及对实验结果的自动分析、评估和总结。未来,利用知识库与实验仪器自动化系统进行对接,可实现对实验仪器的智能控制和调节,以适应不同的实验需求和条件,为实验自动化提供强有力的支撑。“向量数据库技术让大模型更高效率、更低成本的存储和读取专业领域知识,通过向量数据库给大模型动态更新数据,也满足文献快速迭代的实际情况”。墨奇科技副总裁孟卓飞介绍道,“目前我们的向量数据库技术可支持人工智能场景下的千亿级非结构化数据分析,可以有效地在海量非结构化数据的文献数据中发挥价值,实现快速分析文献信息,真正实现了“多、快、好、省”的AI for Science时代下的科学文献智能处理与分析模式。不仅在科研场景,向量数据库技术也可在金融、法律、咨询、教育等知识密集型场景体现其优势。”“希望 Science Navigator 能成为万物与模型之间的桥梁,成为科研领域的数据枢纽”孟卓飞说道,从AI4Science到AI4Knowledge,大语言模型+向量数据库的解决方案对包括金融、资讯、法律在内的知识密集型产业都可以提供强有力且通用性的支撑,让知识检索从面向数据库和检索工具,向下一个自然语言交互的对话时代发展。未来,文献知识库最终的用户可能从现有的人类用户发展到机器用户,借助对话机器人辅助思考,让我们的提问变得自动化。机器可以拆解我们提出的方向性问题,提出质疑点、设计论据,然后进行实验设计,再搜寻实验结论或者进行实验模拟,通过结果进行问题的反思推导和迭代,通过这样一套流程更进一步地释放科研人员的精力。AI for Science高速向前的发展,将为科学研究带来更多新方法与新工具,为领域内解决基础的共性问题,为产业应用的实际场景提供科学研究的基础设施,相信将在材料科学、能源行业、药物研发等方向上带来巨大变革,提升创新效能,创造应用效益。目前Science Navigator已经开放内测,大家可以通过邮箱contact@bjaisi.com进行申请。


  • 原文来源:https://mp.weixin.qq.com/s/EohpV8RI-UrD18Sm-5dUJg
相关报告
  • 《共建AI4S基础设施(三):替代文献的数据库与知识库》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-10-10
    • 无论哪一个学科,文献对于科研工作都是必不可少的,它可以帮助科研人员了解前沿动态和最新成果,学习相关知识和技术,激发创新和灵感,验证理论和实验,同时也是促进学术交流的载体。然而,科研文献更新速度快,数量呈现出爆炸式的增长,如何有效地管理和利用海量的文献资源,成为了科研人员面临的一个迫切的问题。据美国国家科学基金会统计,科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%。 近年来信息技术的飞跃,带来了各种文献搜索引擎如 Google Scholar、CNKI ,学术社交网络 ResearchGate、Academia.edu 等平台可以帮助用户快速找到相关领域的专家和研究成果,EndNote、Zotero 等可以帮助用户管理学术文献,GPT问答式检索的出现翻开文献查找新篇章。即便如此,已有工具仍存在功能单一或不完善、难以与其他的软件或平台进行对接集成,操作方式不简便,需要学习教程等问题。 构建AI for Science基础设施的目标之一就是集中力量解决共性问题,文献是支撑各学科科研工作者研究决策的知识体系,为提升创新效能,有机地将科学家们的集体智慧充分提取出来,构建易用性强、准确率高的替代文献的数据库与知识库,成为AI for Science基础设施建设方向之一。 对于自然科学研究来说,虽然GPT的出现在一定程度上增加了文献查阅的便捷性,但不完全适用于学术性问答的交互,存在局限性。科学文献大多为非结构化数据,且专业属性极强,各个领域的文献更新速度快。由于大模型的结构特点,每一次重新训练的成本都是非常高昂的,怎样让最新的数据高效的覆盖进来也是目前面临的重大问题。 将大语言模型与数据库相结合,可以通过对大量文本数据进行训练来生成语言模型,然后可以将这个模型与数据库结合使用,以便对数据库中的文本数据进行自然语言处理和语义分析。这种结合可以帮助提高数据库的查询和分析能力,从而更好地满足用户的需求。例如,可以使用大语言模型来自动化生成数据库查询语句,或者使用大语言模型来识别和提取数据库中的实体、关系和事件等信息,以便给用户更加智能化和个性化的查询分析服务。 类似这样的场景已经逐步实现:科研人员通过自然语言方式询问“我想知道最近一个月内被提及最多次的技术是什么”,“我想知道最近一个月内人工智能领域发表的论文中出现频率最高的技术是什么”,“删除最近一个月内指标低于 XX 的实验数据”,平台以对话形式返回结果或对数据进行相应操作,极大提高了数据管理的效率。 此外,还可以构建文献推荐系统,通过学习用户的历史行为和偏好,然后将这些信息用于预测用户可能需要关注的文献,并将这些预测结果与数据库中的数据进行匹配,从而提供用户最符合其需求的推荐结果。大语言模型结合向量数据库的方式,还可以加快大批量论文载入时间,降低数据的运算成本。 相较于传统检索方法只能返回精确匹配的文献本身,构建替代文献的知识库与平台工具,可实现多模态交互,并同时支持中英文提问回答方式,将为科研人员提供一个强大的知识信息资源和智能助手,轻松进行查找、阅读、对比分析、总结等需求。 科研数据不仅局限于文献文本,实验方法数据、结果数据、文献中的图表也是重要的数据来源。这也引发了构建实验方法知识库的需求。从海量的科学文献中自动抽取、整理、归纳和表示实验方法的相关信息,包括实验目的、原理、步骤、参数、结果、评价等,实现对实验方法的快速检索、比较、优化和推荐,以及对实验结果的自动分析、评估和总结。比如在合成化学领域,建立合成化学文献的附录,描述已有实验的步骤和结果。通过结构化查询,我们可以将其转化为合成化学实验知识库或数据库,开发人工智能算法进行对比分析,自动给出最佳合成化学路径的建议。利用知识库与实验仪器自动化系统进行对接,来实现对实验仪器的智能控制和调节,以适应不同的实验需求和条件,为实验自动化提供强有力的支撑。 未来,文献知识库最终的用户可能从现有的人类用户发展到机器用户,借助对话机器人辅助思考,让我们的提问也变得自动化。机器可以拆解我们提出的方向性问题,提出质疑点、设计论据,然后进行实验设计,再搜寻实验结论或者进行实验模拟,通过结果进行问题的反思推导或迭代实验设计方案,通过这样一套流程更进一步地提效,也打通了与另一个AI4S基础设施“高精度、高效率的实验系统”的连接。 不仅在自然科学,包括金融、资讯、法律在内的知识密集型产业都可以构建文献知识库,以提供强有力且通用性的支撑,让知识检索从面向数据库和检索工具,向下一个自然语言交互的对话时代发展。 相信,通过建设“替代文献的数据库与知识库”这一重要的AI for Science基础设施,将大大提升文献的检索、阅读、分析及管理效率,进一步助力科研人员提升科研生产力,让科研工作者释放更多的时间精力在解决关键问题与创新思考上。
  • 《2024年开放基础设施状况报告》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2024-11-29
    • 一、所选开放式基础设施的特征 《开放基础设施状况报告》提供了IOI(Invest in Open Infrastructure,投资开放基础设施)的开放基础设施发现工具Infra Finder中列出的OI(Open Infrastructure,开放基础设施)的一般特征的年度快报。 84个OI受邀参与Infra Finder的第一轮数据收集;其中57人接受了邀请并提供了信息。如果在发出邀请时,基础设施已完全运行并作为学术生态系统在整个研究生命周期中履行其功能所需的服务、协议、标准或软件积极使用,则该基础设施有资格被纳入。基础设施还必须满足以下一项或多项资格标准: 符合OSS(open source software,开源软件)的定义; 主要或独家分发开放许可(开放获取)内容; 任何人都可以免费使用(免费或其他限制); 由社区管理,运营和财务透明; 由非营利性或非商业实体运营。 二、开放基础设施赠款资金的现状 在IOI,我们增加对OI投资的工作依赖于对基础设施的融资方式和资金来源的深刻理解。自2020年以来,我们研究、分析并发布了关于OI研究和奖学金资助前景的调查结果。赠款资金只是支持开放式基础设施的一种收入来源,研究表明,财务贡献(包括赠款)是许多OI的主要收入来源。 三、开放式基础设施治理:当前结构、命名法、构成和趋势 许多支持研究和学术的开放式基础设施部署了某种形式的“社区治理”,这是一个相对宽松的术语,用于描述广泛的实践。在最基本的层面上,治理仅仅意味着制定和执行决策,在这个框架内,“社区治理”通常意味着社区的成员以某种方式有意识地参与决策过程。社区治理工作通常是无偿的,由志愿者提供,而不是由工作人员或能够从计划或服务中获得直接经济利益的人提供。 社区治理的概念在整个开放空间中得到倡导,许多开放基础设施明确声称是“社区治理”或“社区主导”的。这种社区参与通常被用作学术交流生态系统内外的差异化和信任的标志。 四、开放式基础设施性能和采用的趋势 根据对各种开放式基础设施服务和计划的观察,通过Infra Finder收集的数据,以及与他们的对话,我们见证并记录了许多关于开放式基础设施增长、发展和向弹性过渡的明确信号。其中包括一系列重要趋势,从新的合作伙伴关系和资金,到技术升级和应用的里程碑。证明这些趋势的具体例子包括由斯隆基金会资助的Dryad和Zenodo之间的合作伙伴关系,其中非营利金融基金召集了6个组织来促进数字人文的财务弹性,全面重建公共访问提交系统,以及全球估计60%的钻石开放获取期刊使用OJS(Open Journal System,开放期刊系统)。2022年,IOI还宣布推出IOI网络采用基金,催化一种新的投资形式,以促进开放基础设施的实施、增长和可用性,从而推进科学研究和数据共享。 五、区域政策发展及其对开放式基础设施的影响 2021年通过的联合国教科文组织开放科学建议书标志着使“科学过程更加透明、包容和民主”的全球运动中的一个有意义的里程碑。虽然这种转变还有其他动机,但现在似乎是时候在这里分享非洲、欧洲、拉丁美洲和美国最近的开放科学和相关政策发展的概述,并反思开放数字研究基础设施的影响。 纵观这些地区,我们注意到用于推进开放科学的杠杆的多样性及其运作的规模。欧洲、非洲和拉丁美洲拥有强大的区域和大陆倡议和/或正在开发或实施的网络,拉丁美洲、欧洲和非洲之间有一些跨洲际的合作。欧盟最近的法律发展及其可能推动开放科学实践并可能使开放科学实践复杂化的潜力也值得注意。相比之下,我们不知道北美各地有重大的开放科学举措;因此,我们在这里的重点是美国,美国联邦政府是开放科学实践的最重要推动者之一。 另一个观察结果是,这一领域的范围和核心优先事项不同。在美国,虽然参与公平是最近政府促进公众获取研究成果的任务的一个组成部分,但它是次要的。公众获取研究成果也是拉丁美洲长期以来的优先事项和政策驱动力。在非洲大陆,获得执行研究处于更平等的地位,但这可能反映了在支持基础设施和获取基础设施方面投资不足的历史。与此同时,欧盟制定了一项雄心勃勃的开放科学政策,该政策侧重于利用数字和协作技术提供早期研究机会,但也嵌入了对整个数字生态系统具有潜在深远影响的技术政策举措中。 六、采购和信息技术治理对其开放式基础设施的影响 作为学术知识基础设施的建设者、促进者和用户,图书馆及其主办机构有责任为其用户提供具有成本效益、可持续且符合使命的服务。基础设施解决方案可以沿着开放性和社区责任的梯度进行定位,从完全开源、社区支持和治理的应用程序和服务,到利用开源应用程序的供应商支持的服务,再到完全专有的商业产品。这些应用程序和服务可以在本地采购和开发(在机构内部提供本地支持和管理),也可以从单个组织或社区的供应商处采购(通过联盟或其他协作努力)。 在可用的技术和服务中进行选择可能会涉及机构的采购和/或信息技术治理流程。为了支持IOI提高开放式基础设施采用率的使命,我们试图了解采购和IT治理流程是否以及如何帮助或阻碍研究机构采用开放式基础设施解决方案,并寻找机会确保公平和平等地考虑开放式基础设施选项。 七、未来信号 受Nesta《未来信号(2023)》报告的启发,团队思考近期的发展、主要矛盾及其对研究和学术领域开放基础设施的投资和采用的影响。 (1)人工智能对研究和学术领域基础设施的影响 随着人工智能(AI)模型、算法和工具的快速发展,以及它们在我们日常生活中日益普及,AI正在重新定义数字研究和学术交流基础设施,以及资助者、机构决策者和研究者的技术投资和采用实践。 ·重新定义研究和学术领域的基础设施 如今,AI工具可以轻易执行或协助许多当前由人类在研究和交流生命周期中执行的任务。它们可以创建和增强元数据、对图像进行分类、进行语言和模式之间的翻译、进行数据分析、改进同行评审等。同样,AI算法在研究人员和学者的研究和学术工作流程中的使用也越来越普遍,例如,自动转录服务用于转录研究访谈,或依赖于机器学习算法的图像分割工具。AI包括其模型、训练数据集,甚至它所依赖的硬件,正在成为研究和学术领域基础设施的一部分。 ·AI:构建更好开放研究基础设施的推动者 自动化为人们创造了机会,使他们能够将劳动集中在最适合人类的任务上,发挥他们的创造力、社交情感智能和复杂问题解决能力。 但存在一种重大风险,即资助者和决策者可能会将AI作为降低成本的策略,而不是作为用相同(或更多)资源实现更多目标并赋能人类工作者的方式。虽然我们承认这种风险,但将AI视为对人类劳动的增强而非替代,可以扩展开放研究基础设施所能实现的潜力。以开放数据共享平台为例,如果一个整理团队利用AI在数据提交过程中或之后立即进行一系列质量检查和元数据增强,他们不仅可以减少人类在乏味或重复任务上的投入,还可以腾出时间来进一步提高数据的可重用性,进行比时间允许的更深入的质量检查,为作者提供支持,或开发促进数据重用的创造性方法。 将AI视为对人类劳动的增强而非替代,可以扩展开放研究基础设施所能实现的潜力。 ·在基础设施决策中以原则和价值观为中心 AI在研究生产和交流中的潜在应用以及研究利益相关者对应用新兴AI工具的兴趣,也给研究执行机构带来了新的挑战。2023年5月的一项联合国教科文组织调查显示,只有不到10%的学校制定了关于在教育中使用生成式AI应用的机构政策或指导。虽然自那以后许多机构已经公布了相关政策,但鼓励在研究中负责任地使用AI的政策制定是否能跟上AI工具的扩散和演变,仍有待观察。特别是,这些工具中许多都具有黑箱特性,这使得验证生成式AI的输出变得困难。 随着AI成为开放研究基础设施的一部分,对于包括我们在内的开放基础设施协会中关心就我们所使用的技术做出明智决策的人来说,重要的问题是,我们如何理解技术选择的影响,以便做出更好的选择?当我们审视开放基础设施和伦理AI的对话时,我们看到存在的相似之处:对透明度、问责制和治理的考虑,对原则和价值观的讨论,以及对开放性是一个谱系的认识。随着AI成为研究基础设施的一部分,我们看到利用我们与基础设施服务提供者和采用者合作的经验来提供信息的机会,以帮助采用者做出更明智的决策。 (2)钻石开放获取模式的基础设施支撑 钻石开放获取(Diamond OA)在诸多方面是对一个旧现象的新命名——自20世纪80年代末以来,某种形式的完全免费的在线期刊就已存在。近年来,随着文章处理费商业模式的泛滥以及与之相关的出版公平性和差异性的讨论,人们对“无付费”出版形式的关注和紧迫感日益增强。 ·摆脱APC 资助者一直在重新考虑和发展他们对开放获取出版和APC的态度。钻石OA是诸如欧洲DIAMAS等大型项目的核心,DIAMAS是一个为期3年的、由欧盟委员会资助的项目,旨在汇集来自12个国家的23个组织,研究推进非营利出版模式(作为APC基础OA的对立面)的模型。诸如cOAlition S和Plan S等努力也汇聚于钻石OA和“出版、评审、策划”出版模式,以此应对科学出版领域的当前挑战。比尔及梅琳达·盖茨基金会最近宣布,他们将于2025年停止支持APC。由于资助者愿意为APC付费,以作为其使命的一部分,使资助的研究成果能够供公众获取,这推动了APC的通货膨胀和泛滥,我们看到这些运动正在回归OA运动的原始宣言,并在一个更加成熟的开放获取出版生态系统中进行。对APC的反感可能会使资金的天平重新偏向钻石OA及其基础设施;或者,它也可能推动其他生态系统(如预印本和同行评审)的进一步发展。 钻石OA被描述为将知识作为公共财富的公平手段,这呼应了21世纪初关于开放获取的原始宣言,并认识到一些以利润为驱动的动机已经使开放获取出版偏离了OA运动的初衷。钻石OA的未来迹象表明,我们正在重新审视OA运动的根源,并正视现实:当前的开放获取出版环境充斥着迅速膨胀和泛滥的APC,与OA运动早期所设想的免费获取理想相去甚远。我们密切关注并致力于推动更加公平的模型,投资于基础设施以及激励措施,以推动向这些模型更加一致的转变。 ·钻石OA面临的风险:以新基础设施投资为代价 现有的出版基础设施生态系统通常依赖于其他基础设施。这一系列幕后基础设施被称为支撑开放科学的“管道”基础设施。我们看到了一个重要机会,即加强已经支撑钻石OA的相互依赖的开放基础设施的“管道”,以构建一个能够与现实中的专有出版工作流程相竞争的强大开放工具链。商业出版商受益于成熟(通常是封闭的)的工作流程系统,这些系统能够支持全方位的出版活动,可靠地将内容从作者传递到读者。新工具和可见性往往能够吸引资金,而现有的开放基础设施则面临在没有大量资金注入的情况下进行增长、演进和投资于研发的挑战。作为一个热门话题,钻石OA面临的风险是以新基础设施的投资为代价,而忽视了那些几十年来一直支撑这些活动的现有基础设施。相反,投资于“管道”——即支撑钻石OA全生命周期的现有相互依赖的基础设施,将加强全球研究社区参与钻石OA运动的基础设施。 (3)数字主权的不同愿景及其对开放知识基础设施的影响 数字主权可以被定义为一个国家、地区或其他政治实体为其自身及其公民的利益而主张对其数字基础设施和数据进行控制的权利。从欧洲数据战略的发展到美国《芯片和科学法案》的出台,近年来,随着各国和地区希望获得对其数字基础设施和数据的控制和独立性,围绕数字主权的讨论日益增多、不断发展,相关政策也迅速出台。 ·数字主权的不同动机和愿景 虽然我们为数字主权提供了一个工作定义,但必须承认,在定义数字主权和接受数字主权的动机方面存在多种方法。这个概念被专制政府所接受,以便对其公民进行社会控制,也被更民主的制度所接受,以保护公民的个人数据和企业在信息经济中的经济利益。在拉丁美洲,对大数据公司和发达国家如何利用数据失去信任是推动数字主权的一个根本原因。数字公共领域的封闭及其被整合到由营利实体开发、维护、许可或出售的基础设施中,这些实体受其所在司法管辖区和用户所在司法管辖区的法规管辖,这使得地理因素变得比早期互联网先驱可能预想的更加重要。这种现象如果发展到极端,就有可能陷入“加拉帕戈斯综合症”,即基础设施变得分离、割裂,形成较小、孤立且不兼容的组成部分。 ·对全球数字研究基础设施的影响 我们好奇数字主权运动的地理“锚定”效应将对全球知识与研究的自由流动及其支撑基础设施产生何种影响。在考虑如何发展和维护可持续、可互操作且全球性的数字研究基础设施时,数字主权可能会影响这些技术在当地的部署方式。例如,云技术需要在本地服务器和云基础设施上运行,以便某个国家的研究人员能够使用。数字主权规定也可能对机构的采购政策产生日益增大的影响,进而影响研究人员和学者能够使用的技术。考虑到那些能够从全球数据源聚合信息而最有可能成功的解决方案,数字主权驱动的对数据共享方式和范围的更多规定与限制,可能会在这些解决方案的开发过程中带来额外的挑战和障碍。 ·开源技术:数字主权的推动者 开源技术因其能够“通过开放性、直接参与和保留实体的自主性来培养信任”,日益被视为数字主权的推动者。在一些地区和国家,政府正加大对开源技术发展的支持和投资,以推进该地区/国家的数字主权。例如,由德国联邦经济和气候保护部支持的主权技术基金,“支持开放数字基础设施的开发、改进和维护”,以确保其“为公共利益中的数字化提供可用性、可访问性和安全性”。特别是在欧洲,区域性和国家性的开源项目办公室数量正在增加。另一方面,在多数世界国家中,政府和私营部门缺乏大规模投资所需数字公共基础设施的资金或技术专长,因此,开源技术有可能为这些国家提供一种可行且成本效益高的替代方案,以替代大型科技公司或资源雄厚、实力强大的国家所提供的技术基础设施。所有这些都可以增加对构建当地能力以开发和维护开放基础设施的全球投资。 随着数字主权相关的发展持续进行,我们认为有必要重新审视追求开放数字研究基础设施的动机。如果实现研究和学术领域开放且公平的访问和参与确实是创建和部署这一基础设施的目标和动力,那么需要在建立对全球开放基础设施的信任方面进行大量投资。如果数据和数字基础设施的独立性和主权是目标和动力,那么就需要大力推动在使用开放基础设施建立联系和网络方面的协作与合作,使各国能够在保持各自控制领域的同时携手合作。