在人工智能技术推动智能互联网发展的时代,人工智能技术与科学研究深度耦合,推动了“人工智能驱动的科学研究”(AIforScience,AI4S)的研究范式变革。AI4S的研究得到世界各国政府、产业界、学界的极大关注和重视,对于推动科技变革、提升国家竞争力具有重要作用,AI4S的演进过程和逻辑结构是什么样的?AI4S在主要领域的应用情况如何?AI4S的发展机遇和挑战有哪些?信息资源管理学科如何应对AI4S革命?以下是《农业图书情报学报》2023年12月发表的专家笔谈观点。下文整理了中国农业科学院孙坦研究员的观点。他提出支撑AI4S的智能知识服务的三个任务:(1)包括树立大文献观,深挖全文知识要素,(2)兼顾普惠与专深,自主打造核心产品(3)与专业领域深度握手,支撑跨学科创新。
AI4S战略及现实意义深远,必然会给自然科学带来变革性影响。2024新年伊始,国家数据局等17部门联合发布的《“数据要素*”三年行动计划(2024-2026年)》强调要面向基础学科提供高质量科学数据资源与知识服务,驱动科学创新发现,深入挖掘各类科学数据和科技文献,通过细粒度知识抽取和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。探索科研新范式,充分依托各类数据库与知识库,推进跨学科、跨领域协同创新,以数据驱动发现新规律,创造新知识,加速科学研究范式变革。为此,专业科技信息机构需要重新审视AI4S环境中知识服务及其在全面支撑科技创新进程中的重要角色与新的任务。
1. 树立大文献观,深挖全文知识要素
科技文献全文蕴含丰富的知识,可以充分挖掘全文内容,向全文野要冶知识,集聚人工智能场景数据资源,建设高质量多模态特色语料知识库。加强富知识要素的全文资源、领域特色资源等多源采集汇聚、深度碎片加工、语义知识组织(词表、图谱、专家库、机构库、领域实体库等冤、本地长期存储,以及标注训练数据等建设工作,全面提升数据治理与知识组织水平,为人工智能应用提供坚实语料基础,为全面数字化转型提供理论方法、技术工具供给。
2. 兼顾普惠与专深,自主打造核心产品
中国科技人员文献需求仍旧非常旺盛,亟需缓解高质量产品的需求与不平衡不充分的知识服务供给之间的矛盾,实现科技文献知识的野共同富裕冶,实现科技文献基础性保障服务平台自主可控,助力科技强国建设。研发语义智能检索与泛在发现获取平台及大模型驱动的专业领域通用知识发现系统,构建问题和场景驱动的新型知识发现工具体系,深度集成应用深度学习、大语言模型等人工智能技术,研发人机对话式专题知识发现服务工具,如问答式检索、生成式综述等。
3. 与专业领域深度握手,支撑跨学科创新
为了适应跨学科研究范式发展,需要建设野跨学科数据+AI驱动冶的知识密集型数字科研计算平台。重点围绕我国在生物育种研发、基因研究、新材料研发等领域的战略部署,以需求为导向谋划人工智能技术应用场景,深度融合人工智能模型算法和领域数据知识,为重大科学问题和发现的研究突破提供助力,开辟新领域、新赛道,塑造新动能、新优势。
引用:孙坦, 张智雄, 周力虹, 等. 人工智能驱动的第五科研范式(AI4S)变革与观察[J]. 农业图书情报学报, 2023, 35(10): 4-32.