《机构知识库:数字学术的必备基础设施》

  • 来源专题:图书情报
  • 编译者: lixiaoyan
  • 发布时间:2018-12-07
  • 2002年秋季,在持续的网络信息革命中发生了一些非同寻常的事情,机构知识库的发展成为一种新的战略,它允许大学应用严肃的、系统的方式来加速学术和学术交流中发生的变化,支持现有的出版商通过许可法人方式来实现学术出版的现代化,扩大了与特定联盟、伙伴的关系,探索更具革命性的数字媒体的新用途。

    许多技术趋势和开发工作汇集在一起,使这一战略成为可能:在线存储成本大幅下降;开放档案元数据收集协议等标准现已出台;基础元数据本身的标准也取得了一些进展。过去五年中对数字保存的思考已经发展到需求得到广泛认可和明确定义,技术方法至少在表面上得到了规划,现在亟需采取行动。

    本文谈论机构知识库作为支持使用网络信息推进奖学金的战略的作用和重要性,总结和阐述关于机构知识库的性质和功能及其在转变学术交流中的作用。

相关报告
  • 《共建AI4S基础设施(三):替代文献的数据库与知识库》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-10-10
    • 无论哪一个学科,文献对于科研工作都是必不可少的,它可以帮助科研人员了解前沿动态和最新成果,学习相关知识和技术,激发创新和灵感,验证理论和实验,同时也是促进学术交流的载体。然而,科研文献更新速度快,数量呈现出爆炸式的增长,如何有效地管理和利用海量的文献资源,成为了科研人员面临的一个迫切的问题。据美国国家科学基金会统计,科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%。 近年来信息技术的飞跃,带来了各种文献搜索引擎如 Google Scholar、CNKI ,学术社交网络 ResearchGate、Academia.edu 等平台可以帮助用户快速找到相关领域的专家和研究成果,EndNote、Zotero 等可以帮助用户管理学术文献,GPT问答式检索的出现翻开文献查找新篇章。即便如此,已有工具仍存在功能单一或不完善、难以与其他的软件或平台进行对接集成,操作方式不简便,需要学习教程等问题。 构建AI for Science基础设施的目标之一就是集中力量解决共性问题,文献是支撑各学科科研工作者研究决策的知识体系,为提升创新效能,有机地将科学家们的集体智慧充分提取出来,构建易用性强、准确率高的替代文献的数据库与知识库,成为AI for Science基础设施建设方向之一。 对于自然科学研究来说,虽然GPT的出现在一定程度上增加了文献查阅的便捷性,但不完全适用于学术性问答的交互,存在局限性。科学文献大多为非结构化数据,且专业属性极强,各个领域的文献更新速度快。由于大模型的结构特点,每一次重新训练的成本都是非常高昂的,怎样让最新的数据高效的覆盖进来也是目前面临的重大问题。 将大语言模型与数据库相结合,可以通过对大量文本数据进行训练来生成语言模型,然后可以将这个模型与数据库结合使用,以便对数据库中的文本数据进行自然语言处理和语义分析。这种结合可以帮助提高数据库的查询和分析能力,从而更好地满足用户的需求。例如,可以使用大语言模型来自动化生成数据库查询语句,或者使用大语言模型来识别和提取数据库中的实体、关系和事件等信息,以便给用户更加智能化和个性化的查询分析服务。 类似这样的场景已经逐步实现:科研人员通过自然语言方式询问“我想知道最近一个月内被提及最多次的技术是什么”,“我想知道最近一个月内人工智能领域发表的论文中出现频率最高的技术是什么”,“删除最近一个月内指标低于 XX 的实验数据”,平台以对话形式返回结果或对数据进行相应操作,极大提高了数据管理的效率。 此外,还可以构建文献推荐系统,通过学习用户的历史行为和偏好,然后将这些信息用于预测用户可能需要关注的文献,并将这些预测结果与数据库中的数据进行匹配,从而提供用户最符合其需求的推荐结果。大语言模型结合向量数据库的方式,还可以加快大批量论文载入时间,降低数据的运算成本。 相较于传统检索方法只能返回精确匹配的文献本身,构建替代文献的知识库与平台工具,可实现多模态交互,并同时支持中英文提问回答方式,将为科研人员提供一个强大的知识信息资源和智能助手,轻松进行查找、阅读、对比分析、总结等需求。 科研数据不仅局限于文献文本,实验方法数据、结果数据、文献中的图表也是重要的数据来源。这也引发了构建实验方法知识库的需求。从海量的科学文献中自动抽取、整理、归纳和表示实验方法的相关信息,包括实验目的、原理、步骤、参数、结果、评价等,实现对实验方法的快速检索、比较、优化和推荐,以及对实验结果的自动分析、评估和总结。比如在合成化学领域,建立合成化学文献的附录,描述已有实验的步骤和结果。通过结构化查询,我们可以将其转化为合成化学实验知识库或数据库,开发人工智能算法进行对比分析,自动给出最佳合成化学路径的建议。利用知识库与实验仪器自动化系统进行对接,来实现对实验仪器的智能控制和调节,以适应不同的实验需求和条件,为实验自动化提供强有力的支撑。 未来,文献知识库最终的用户可能从现有的人类用户发展到机器用户,借助对话机器人辅助思考,让我们的提问也变得自动化。机器可以拆解我们提出的方向性问题,提出质疑点、设计论据,然后进行实验设计,再搜寻实验结论或者进行实验模拟,通过结果进行问题的反思推导或迭代实验设计方案,通过这样一套流程更进一步地提效,也打通了与另一个AI4S基础设施“高精度、高效率的实验系统”的连接。 不仅在自然科学,包括金融、资讯、法律在内的知识密集型产业都可以构建文献知识库,以提供强有力且通用性的支撑,让知识检索从面向数据库和检索工具,向下一个自然语言交互的对话时代发展。 相信,通过建设“替代文献的数据库与知识库”这一重要的AI for Science基础设施,将大大提升文献的检索、阅读、分析及管理效率,进一步助力科研人员提升科研生产力,让科研工作者释放更多的时间精力在解决关键问题与创新思考上。
  • 《印度实施“乳制品加工及基础设施发展基金”计划》

    • 来源专题:农业科技前沿与政策咨询快报
    • 编译者:梁晓贺
    • 发布时间:2017-11-28
    • 印度总理、印度经济事务内阁委员会(Cabinet Committee on Economic Affairs, CCEA)主席纳伦德拉·莫迪(ShriNarendraModi)近期批准了一项“乳品加工及基础设施发展基金(Dairy Processing & Infrastructure Development Fund, DIDF)”项目,预期拨款1,088.1亿卢比,项目执行期限为2017-2029年。 一、经费来源 根据2017-2018联邦预算(Union Budget)的通告,DIDF的经费将由多方面组成。经支出财务委员会(Expenditure Finance Committee)批准,印度国家农业和农村发展银行(National Bank for Agriculture and Rural Development, NABARD)将担负其中的800.4亿卢比。 二、经费分配 DIDF的启动和设立预计花费1,088.1亿卢比,其中NABARD提供给印度国家乳制品发展委员会(NDDB)和国家乳制品发展合作社(NCDC)800.4亿卢比贷款,共分3次支付,分别为2017-2018年支付200.4亿卢比、2018-2019年间支付300.6亿卢比、2019-2020年间支付299.4亿卢比;为最终受益方捐赠200.1亿卢比;资助NDDB/NCDC1.2亿卢比;提供给畜牧业、乳业及渔业部(Department of Animal Husbandry, Dairying & Fisheries, DADF)86.4亿卢比的利息补助金,预计在12年内完成发放。 三、主要活动 DID项目将通过为牛奶联盟(Milk Unions, MU)/ 牛奶生产公司(Milk Producer Companies)建立冷却基础设施、安装电子检测掺杂物设备、制造/扩建加工基础设施和增值产品的制造能力,来着重建设有效的牛奶采购系统。 四、项目管理 项目由NDDB和NCDC负责,以MU、国家乳制品联合会(State Dairy Federations)、多邦牛奶合作社(Multi-state Milk Cooperatives)、牛奶生产公司以及符合该项目条件的NDDB下属机构等为最终受益方。NDDB下属位于阿纳恩德县(Anand)的实施和监察指挥部(Implementation and Monitoring Cell, IMC)负责项目的日常实施和监察。最终受益方将以6.5%的年利率获得贷款,偿还期限为10年,包括2年的延期偿付期。各邦政府为还贷担保人。为保证项目获得批准,如最终受益者无法偿还其份额,政府将代为偿还。 五、项目的效益 该项投资将使大约5万个村庄的950万农民获益。使牛奶加工量增加1.26亿升/日,牛奶干燥量增产2.1亿吨/日,牛奶冷却能力增加1.4亿升/日。安装28,000台牛奶冷却罐(Bulk Milk Coolers, BMC)和电子检测掺杂物设备,每日增值产品生产增加5,978万升牛奶当量。项目最初将资助12个邦的39个盈利MU,在接下来几年中,其他净值和盈利水平符合标准的牛奶合作社也可申请DIDF的贷款。 六、就业潜力 DIDF项目的实施将为技术工人、半技术工人、非技术工人提供直接、间接的就业机会。通过对现有牛奶加工设施的扩建/现代化、建造新的加工厂房、增值产品的制造设施以及在农村建立BMC,将会直接提供约4万个就业岗位;将目前一线、二线、三线城市的牛奶、牛奶产品的市场营销活动拓展至四线、五线、六线城市/乡镇,能间接产生约20万个就业岗位;在城乡开设奶站/零售店,需要众多市场营销人员和分销商;此外还增加对牛奶运输人员、运输监督人员和兽医等人才的需求。 (编译 梁晓贺)