《张晓林 从猿到人:探索知识服务的凤凰涅槃之路》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-07-13
  • ChatGPT的横空出世,给所有以数据和信息为原料、以“知识”为产出的行业带来了如埃隆·马斯克所说的“存在主义焦虑”(Existential Angst)。而且,ChatGPT的持续迭代正以迅雷不及掩耳之势扑面而来,例如跨模态能力的 GPT-4、ChatGPT和 Whisper API接口开放、微软推出 GPT-4 Office全家桶全面提升办公生产力等等。许多专家分析总结了ChatGPT 的技术及其发展趋势,作为知识服务的实践者,我更希望了解ChatGPT革命对知识服务带来的挑战和可能的应对,因此提出个人见解抛砖引玉。

    1 ChatGPT将使传统知识服务的优势荡然无存

    我们已经看到,ChatGPT具备编写程序、通过专业考试、编辑新闻稿、提出案件或病例知识背景总结的能力。上海交通大学图书馆李新碗馆长最近已实例展示了ChatGPT充当学科馆员回答咨询问题、作为助手协助撰写项目申请书态势综述的良好表现。我在上海科技大学情报服务中已用 ChatGPT 回答用户调研问题,几轮Prompts后答案达到有较好积累的情报人员水平。毋庸讳言,目前大多数基于数据、文献或网络信息进行收集、梳理、总结的数据分析、学科咨询、情报研究等传统知识服务都能通过 ChatGPT 类工具与 Prompt机制的结合来很好完成。

    我想到清华大学钱颖一教授在2021年提出的判断:人工智能将使中国教育优势荡然无存。他指出,中国教育的长处是教师对知识点的传授、学生对知识点的掌握,量多面广,所以中国学生对基本知识达到高水平的掌握。但是,中国教育的最大问题是对教育从认知到实践都存在一种系统性的偏差,把教育等同于知识并局限在知识上。教师传授知识、学生接受知识,考核(高考)也是考知识,知识几乎成了教育的全部内容,实践能力、创造性、好奇心、兴趣爱好等要素存在结构性缺失。而人工智能是通过机器进行深度学习来工作,即大量地识别和记忆已有的知识积累。它完全可以替代甚至超越那些通过死记硬背、大量做题而掌握知识的人脑。因此,未来的人工智能会让我们的教育制度下培养学生的优势荡然无存。现在看来,钱教授“不幸言中”。也许更为不幸的是,如果把“教育”换成“文献情报工作”或“知识服务”,他的结论相当普遍地依然成立。

    2 ChatGPT正展现知识服务的具有“量子优越性”的新生命形态

    很多专家总结了ChatGPT“为什么能”,例如它所依据的GPT机制(Generative Pre-trained Transformer)和大语言模型(Large Language Model,LLM)等。但它之所以成为ChatGPT,根本地在于它的InstructGPT,通过基于人类反馈的强化学习(Reinforcement Learning from Human Feedback),在有监督的语义微调和指令微调(Supervised Fine-Tuning和 Instruction Fine-Tuning)和通过近似策略优化(Proximal Policy Optimization,PPO)的奖励模型等支持下,支持生成思维链(Chain-of-thought),提高了ChatGPT“知道知道”和“知道不知道”的能力、减少“不知道知道”和“不知道不知道”的限制、同时通过逐步思考帮助它回答其不知道的问题。

    从知识服务角度,我感受到两个关键点,一是它一直致力于回答用户想要解决的问题,而不仅是为解决用户问题而检索信息;在如此做时它一直是在回答用户问题过程中学会回答问题,一直自然地嵌入用户的场景和过程中服务人类和优化自己。二是大模型所体现出来的“涌现”能力。所谓“涌现”,指“当大量相似的实体彼此之间以及与所处环境在低尺度上相互作用时,更高的时空尺度上就可能自发产生许多意想不到的结果。这种非同小可的现象被称为‘涌现’(Emergence),这是各类复杂系统都有的特征”。ChatGPT所体现出来的强大思考能力就是大语言模型下的涌现的结果。有了人类自然加持和大规模复杂系统的涌现能力,ChatGPT重塑了知识服务的新生命形态,对传统知识服务形成降维式打击。这些特点值得我们深思。


    3 ChatGPT正逼迫我们突破从猿到人的生存屏障

    我的一个从事计算政策学研究的博士生“不幸”在论文即将预答辩时遭遇了ChatGPT,他花了相当心血的实体及实体关系抽取工作被ChatGPT“优雅而无情”地碾压,通话时隔着手机屏幕都能感受到他的“价值焦虑”甚至“存在焦虑”。

    我们一起分析了他的博士论文是研究什么和如何研究的。其实,他是从政策失灵的真实的复杂问题出发,询证计算相关领域的政策在分类施策、精准施策、协同施策、组合施策等方面可能存在的问题和可能解决途径。实体与实体关系的抽取只是初步基础,但研究的核心是探索How和Why以及可能的What If。创新性研究(包括但不限于博士论文研究)是从问题到数据到信息到知识到智慧到解决方案的探索过程,对应是计算智能、感知智能、认知智能、决策智能的不同阶段。诚然,许多研究在一定阶段需要计算智

    能或感知智能来描述What以及部分How,包括内容抽取、实体抽取和计量分析等,但感知智能聚焦的主要是对象和关系,是关联性探索和描述(ChatGPT说到底是相关关联——“这些语句最有可能与这些问题相关且各自最可能如此相关”),但认知智能、决策智能主要是探索解释性的How、Why和预测性的What If、Why If。在数据、算力和算法迅速发展的今天,需要迅速和实质性超越计算智能和感知智能。

    要实现认知智能和决策智能,需要对复杂决策环境及其因果动力学的把握。因果关系推理涉及图灵奖获得者Judea Pearl提出的三个层次,“见”——即通过观察在事物之间建立联系的能力;“做”——即对某事做出改变,并关注后果;“反事实”(Counter Factual)——即提出“如果……会如何”,推测未采取行动的后果,建立想象不同情景的能力。人工智能主要由深度学习(Deep Learning)推动,可以学习如何把一个事物与另一事物相关联,随后这些关联性可以投入实际应用。但这只是登上梯子的第一阶,这把梯子应该通向更高目标,即“深度理解”(Deep Understanding),尤其是高阶复杂系统下的因果关系的理解。应该说,ChatGPT目前还主要是计算智能和感知智能,但部分突破了(尤其在Prompt的帮助下)认知智能。

    目前看来,这份博士论文研究还是立足于决策智能高度,通过贯通问题+数据+情报+知识+智慧+可能解决方案,试图探索How和Why以及What If,因此至少现在还有其创新意义,不至于被后浪拍死在沙滩上。这个案例也许对知识服务有普遍意义。我们做什么和怎么做决定了我们的生存几率。但现在我们没有选择的余地,必须从计算智能和感知智能的舒适区走出来,从在树梢上轻松地四肢蹦跶到勇敢站在大草原上学会直立行走,尽快在技术(不知什么时候)赶上来之前驾驭认知智能和决策智能的挑战。

    4 知识服务在ChatGPT时代的凤凰涅槃之路呼唤新的生命机制

    面对ChatGPT,知识服务领域的各种探索在迅速展开。我并不假装自己已做过系统思考,更多是提出可能探索的做什么和怎么做、以及它们的难点痛点:如何拥抱ChatGPT及类似工具,重塑融入用户场景、用户认知驱动的感知型知识服务能力?我在上科大情报馆员团队讨论学校战略情报调研时要求,对每个问题先用ChatGPT跑一遍,尤其是从用户解决实际问题出发、通过对 ChatGPT 不断提示(Prompt)来优化 ChatGPT 的回答。但难点在于:用户的实际问题到底是什么?用户看到 ChatGPT 各梯次回答后又会提出什么问题?不同用户根据自己个性化情景又会提出什么问题?需要什么样的技术、系统、服务机制等来形成自然的类 Prompt Engineering服务?如何把它建设成用户可信赖、服务可持续、市场可竞争力的服务机制?等等。

    如何构建针对用户复杂问题及其解决方案的认知型决策型知识服务能力?恐怕不得不重新思考知识服务的定位和目标,避免停留在指标计算型或资料整理型的服务。首先,要针对用户要解决的复杂问题,将“情报分析”上升到“政策分析”和“战略分析”,例如“机构与环境条件敏感的某领域引领性突破性颠覆性研究培育策略”,而不是基于某个或某些指标的“研究人才学术竞争力评价”?毫无疑问,这将考验我们对真实问题环境的多目标多维度多因素复杂系统的把握。其次,这类服务往往需要多维度、多样化、异构化的大规模数据,这将打破我们习惯的分割化、还原论的情报分析思维,也要求重组“集成分析”所涉及的数据覆盖面、分析细粒度和融汇计算与理解能力。第三,需要充分利用大数据驱动的深度学习和深度理解能力,需要建立AI for Policy Analysis的理论与实践。第四,需要把大数据驱动的依赖深度学习和涌现的推理,和人工专家设计与引导下的基于指标的启发式发现结合起来,例如参考对抗生成网络和 Prompt Engineering方法,形成两者既对抗又相互引导的“深度理解机制”?当然,“传统”的科学计量学和计算政策学方法可以也应该被融汇到其中。

    如何以知识服务支持 AI for Science(简称 AI4S,这里 Science 包括科技、人文、社会科学领域)?国际货币基金组织(IMF)原副总裁朱民先生提出,AI 赋能科学研究将成为未来全球科技竞争的前沿。全球范围 AI4S已经风起云涌。但 AI赋能科学的作用机理不断演变,可能包括:(1)对相对明确问题和相对单一数据集,通过包括海量数据深度学习在内的各种 AI 方法与工具快速筛选隐藏的特征及关系或可能,大幅度提高研究效率。(2)对高度复杂数据集和具有较大不确定性的问题,借助大规模复杂数据带来的涌现现象去发现事先不知道或根本没想到的特征及关系及规律,提高突破性颠覆性。(3)对高度复杂的多层多维的模糊、动态环境,借助高复杂度大规模数据的涌现潜力及其对多阶因果推理的探索潜力,去探索新的理论与技术方向、新的框架或机制可能。知识服务、尤其是面对科技创新的知识服务,显然不能自外于风起云涌的 AI4S 这种科学研究 5.0 范式。那么,如何以实质贡献方式参与到这些工作中?如何协助构建具备不同复杂度的可计算的数据基础?如何在科研环境和过程中嵌入我们前面提到的认知型决策型的智能服务?如何以智能手段在这样的环境中协助提供相应的安全管理、权益管理、道德与诚信管理、可信赖性管理等服务?等等。如何改造和发挥文献情报系统传统的资源能力?文献情报机构号称拥有知识宝库,一种自然的冲动就是建设自己的大语言模型或ScienceGPT。但我个人对这类行动的合理性、可行性、成本效益、可预见的市场竞争能力等持谨慎态度(谁说ChatGPT不是ScienceGPT?),它至少不是知识服务行业可普遍选择的道路。但是,如何让馆藏(包括网络下数实结合的“资源体系”)形成可全尺度全模态全粒度计算的大规模数据基础?如何把包括人、机构、项目、社区、活动在内的各类知识对象转换成全域全模态全粒度可计算的大规模知识体系?如何为这种知识基础提供高度智能的应用支持能力(包括但也许不仅仅是接入 ChatGPT或文心一言)?

    如何让这种服务全粒度可定制可解析地接入用户知识过程及其在AI驱动下的服务流程中?以及,如何结合规 范 化 内 容 体 系 和 知 识 解 析 分 析 能 力 来 试 验 服 务 于 垂 直 深 度 场 景 的 DrugGPT、MaterialsGPT、EnergyGPT?等等。可能还有许多可做。许多支撑技术和机制已经或者即将到位,而且技术与人才都是逼出来的,毕竟ChatGPT的成功经验之一是“用起来才用得好”。其实,我们最大的敌人是我们自己,是我们长期熟悉、习惯、热爱、甚至为之骄傲的那些“立身之本”(还包括服务模式)。我们必须想想,为什么发明了Transformer的Google被OpenAI打败了?Google把Transformer和GPT主要用来支持“信息搜索”,它太喜欢自己的“优势能力”,不希望包括它自己发明的创新来颠覆它。历史上,具有强大优势地位的主导者被新兴创新者打败的例子比比皆是,如数码相机打败柯达、手机打败数码相机、外卖打败方便面、微信打败扒手等。即使在科学领域也已有过AlphaFold2打败了半个结构生物学界的前车之鉴。这里,需要的恐怕不是利用AI的修修补补,而是从猿到人式的范式转变。




  • 原文来源:https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C44YLTlOAiTRKibYlV5Vjs7ioT0BO4yQ4m_mOgeS2ml3UIeetufgqlZriMGRC0FCc0x5wuzP2URR9deYuWa7Nt8o&uniplatform=NZKPT
相关报告
  • 《从猿到人:探索知识服务的凤凰涅槃之路 --张晓林》

    • 来源专题:数智化图书情报
    • 编译者:黄雨馨
    • 发布时间:2023-09-17
    • 从猿到人:探索知识服务的凤凰涅槃之路  张晓林 DOI:10.11925/infotech.2096-3467.2023.0166 ChatGPT的横空出世,给所有以数据和信息为原料、以“知识”为产出的行业带来了如埃隆·马斯克所说的“存在主义焦虑”(Existential Angst)。而且,ChatGPT的持续迭代正以迅雷不及掩耳之势扑面而来,例如跨模态能力的GPT-4、ChatGPT和Whisper API接口开放、微软推出GPT-4 Office全家桶全面提升办公生产力。
  • 《知识的智慧化、智慧的场景化、智能的泛在化——探索智慧知识服务的逻辑框架》

    • 来源专题:数智化图书情报
    • 编译者:黄雨馨
    • 发布时间:2023-09-17
    • 知识的智慧化、智慧的场景化、智能的泛在化——探索智慧知识服务的逻辑框架 张晓林,梁娜 数字化转型+AI环境下,我们正处于知识生态环境和知识技术体系的交汇重塑中,对知识、智慧和智能基础设施的认识很大程度上将决定我们的生存方式和生存几率。知识对象已内在地结构化、语义化、可定制、可关联,已涵盖从内容对象到知识关系网络到知识创造与利用流程,成为可交互、可计算的智能体。在智慧化的各类知识对象支持下,通过场景驱动的创新机制,可在用户解决问题的过程中,通过数据、模型、计算和交互来支持感知智能、认知智能和决策智能。通过泛在智能机制(智联网),利用边缘智能、智能集成感知体、智慧知识内容对象、智慧化业务流程与管理机制等,可积极推动智慧知识对象生态体系的构建与管理、知识与数据双驱动的问题分析与决策推理、多源资源环境下AI赋能的个性化知识服务的动态构建,以有效推动智慧知识服务的普惠可及。为实现上述愿景,重要的是运用第一性原理思维,推动新形势下的服务逻辑和业务机制的范式转变。