《生成式人工智能十大趋势与公共文化机构的应对策略》

  • 来源专题:数智化图书情报
  • 编译者: 杨小芳
  • 发布时间:2025-07-01
  • 本文探讨了生成式人工智能(GAI)的十大发展趋势及其对公共文化机构的影响。这些趋势包括AI驱动的科学研究普及、具身智能机器人提升服务体验、多模态大模型走向实用化、合成数据与数据治理挑战凸显、世界模型与因果推理能力突破、AI算力与模型优化协同发展、智能体技术普及带来产品爆发、资本投入与产业整合加速、开源生态与小模型应用扩展以及AI伦理与治理框架完善。公共文化机构应把握AI带来的机遇,提升服务效率与质量,实现智能化转型。

    AI驱动的科学研究普及:大模型与深度学习的发展催生了“人工智能助力科学研究”的新模式。2024年,大型语言模型在多个领域取得重大进展,如OpenAI的o3推理模型和谷歌的Gemini 2.0,以及DeepSeek R1推理模型的问世,降低了模型训练和推理成本,推动了AI4S和AI4DH的普及。图书馆等机构可借助这一趋势优化馆藏管理,构建智能数字档案库。

    具身智能机器人提升服务体验:2024年是人形机器人技术的“应用元年”,特斯拉、波士顿动力公司和优必选等企业在具身智能领域取得重大进展。2025年,特斯拉的Optimus和国内智元机器人的批量生产标志着具身智能技术的重大突破。图书馆可利用具身智能机器人提升工作效率和服务质量。

    多模态大模型走向实用化:2024年,多模态技术持续爆发,视频生成与理解模型迎来“GPT时刻”。如OpenAI的Sora、快手科技的Kling和DeepSeek的Janus-Pro等模型的出现,预示着AI在多模态综合处理能力上的提升。未来,图书馆服务平台可借助多模态大模型实现跨媒体数字化展示。

    合成数据与数据治理挑战凸显:2024年下半年,多个先进模型采用合成数据。合成数据技术可降低对真实数据的依赖,解决数据隐私和版权问题,但也面临数据质量、安全性和合规性等挑战。图书馆等机构需强化数据治理体系,确保数字资源的质量和合规性。

    世界模型与因果推理能力突破:2024年,世界模型成为人工智能领域的焦点议题。世界模型的核心特征包括物理世界建模、因果推理能力和动态场景生成。未来,具备因果推理能力的AI系统将能预测未来动态,解决复杂问题。图书馆可利用世界模型技术辅助空间规划、构建沉浸式虚拟展览等。

    AI算力与模型优化协同发展:在GAI技术的发展中,算力和模型优化呈现出协同发展态势。2024年多项研究发现,单纯扩充数据和增加算力的边际收益下降,未来模型训练将重视数据质量、后训练和强化学习技术的应用。图书馆等机构可结合本地算力配置,依托高性能硬件,支持大规模数据存储和智能检索。

    智能体技术普及带来产品爆发:2025年被视为智能体发展的元年,智能体框架日益繁荣与标准化。未来,机器人流程自动化、个人助理、客户服务和数据分析等领域将基于智能体技术开发新一代应用。图书馆可利用智能体实现自动化客服、智能问答和个性化推荐。

    资本投入与产业整合加速:2024年,AI技术发展显著,多款产品在实际应用场景中取得广泛应用。全球主要科技公司和投资机构加大对AI领域的投入,推动AI产业生态的整合与升级。图书馆应抓住资本投入带来的机遇,与科技公司合作获取技术支持。

    开源生态与小模型应用扩展:开源生态系统降低了AI技术的学习和使用门槛,推动了技术的创新和迭代。2025年初,DeepSeek的开源推动了算力护城河的倒塌,开源生态可望超越Meta成为AI领域的安卓。未来,更多高级AI将转向在个人设备上运行。图书馆等机构可利用开源基座模型训练自己机构的领域模型。

    AI伦理与治理框架完善:随着GAI技术的发展,其潜在风险和不确定性日益受到关注。2024年,联合国、世界卫生组织和中国信息通信研究院等纷纷强调建立AI伦理与治理框架的重要性。图书馆等机构需关注数据安全、隐私保护与版权管理,制定数据使用规范,确保AI服务的公平透明。

  • 原文来源:http://mp.weixin.qq.com/s?__biz=MzIxOTI0NDAwNQ==&mid=2247511163&idx=3&sn=2b544db7299a939b275117d7806d0966&chksm=96cec036773ef12fc8ff4564361f20a0a4934129eb85be9188d212b4d707722fe91ee1db41fd&scene=126&sessionid=1751049684#rd
相关报告
  • 《2025年人工智能十大趋势》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2024-10-30
    • 美国《福布斯》日前刊登题为《人人都必须为2025年的十大人工智能趋势做好准备》的文章,作者为未来学家伯纳德·马尔。文章深入剖析了2025年人工智能(AI)的十大趋势,这些趋势不仅预示着技术的不断进步,也反映了人类社会在面对科技变革时的适应与挑战。 趋势一:增强型工作今年,几乎所有主要的软件工具都在匆忙整合生成式人工智能功能。谁都不愿意错过这次上船的机会。2025年,我预计,人类将更多地考虑如何与人工智能携手合作,扩展我们的技术能力,同时腾出时间把我们的创造性和人际交往技能应用到机,器仍然无法管理的工作中这不是简单地把聊天机器人添加到所有领域,而是未来一年智能企业开始利用人工智能创造真正价值的方式。 趋势二:实时自动决策随着企业开始从战略上应对利用人工智能的挑战,那些拥有更加成熟的人工智能战略的企业将走向整个业务流程的端对端自动化。这很可能发生在物流、客户支持和营销领域,算法将在这些领域进行决策,比如如何管理库存和如何以最小的人为干预回应客户问询。这将带来更高的效率和对变化中的客户习惯与市场状况更快的反应速度。 趋势三:“负责任”的人工智能在2025年,人们将日益意识到以一种合平伦理、安全、透明、可靠和尊重知识产权的方式开发和部署人工智能的重要性。虽然这其中有部分将由立法推动(后文有更多涉及),但人们也,越来越意识到不负责任地使用人工智能可能造成的危害。许多人现在意识到人工智能偏见和幻觉的危险,并明白要将这种危险降到最低需要人类协同一致的努力。选择无视这一点或走捷径的企业在2025年可能会被曝光、遭遇监管机构的压力和顾客的抛弃。 趋势四:文生视频与新一代语音助手想象一下:你可以仅仅写出一部电影的主要情节,或是一段视频的一个小片段,然后,整个视频就会在你眼前真实播放出来。想想ChatGPT(聊天生成预训练转换器),只不过生成的是活动的图像。OpenAI公司今年利用其Sora(“天空”)模型展示了这一概念,2025年它可能会开始投入使用。虽然我不认为人们马上能根据提示创作出让迪士尼公司失去收入的电影,但这是令人着迷的一瞥,可以让人看到,在不久的将来人工智能将走向何方,以及它可能具备的能力。 趋势五:人工智能立法和监管更加完善人工智能语音助手(想想Siri或Alexa)多年来已经成为我们生活中的一部分,但传统上他们的对话能力非常有限。今年,OpenAl为ChatGPT展示了一种新的“可中断"的先进语音模式,能够进行与人类对话高度类似的对话。而谷歌已经开始将Gemini (“双子座”"人工智能模型)聊天机器人整合到移动设备中,取代现在已经过时的"Hey Google"功能。我认为,2025年,我们将看到这些能力出现在越来越多的设备中,使之能够进行更自然、更有意义的语音沟通。 趋势六:人工智能体或将流行可以公正地认为,迄今为止,各国政府和立法人员一直在努力应对监管人工智能的挑战。今年,欧盟和中国通过了旨在限制人工智能造成伤害可能性的法律。措施包括将“深度伪造”定为犯罪,对金融、执法等领域应用人工智能进行规范等。2025年,我们可以预期更多规定出台,重点是优先考虑人权,将发生歧视和虚假信息的可能性降至最低。 趋势七:“后真相”世界我们今天看到的大多数人工智能工县都是以执行简单任务为基础,比生成文本或解读数据以作出预测,人工智能体是能够在没有得到精确指令的情况下运作的工县,它们会把无数任务串在一起,并根据所取得的结果调整自己的行为。这可以被视为实现“通用"人工智能的重要一步,它能够完成许多不同类型的任务。然而,这也让人们更加质疑人工智能监管和问责的必要性。 趋势八:人工智能+网络安全2025年,整个社会将面临人工智能带来的假内容和假消息爆发式增长的重大挑战。今年在全球范围内已发生干预选举的尝试。有人说,这意味着我们已经到了一个“后真相"时代,我们不再能够相信自己的眼睛看到的一切。2025年,我预计社会将开始应对这一挑战。这一改变将由各国政府通过立法推动,同时也将在民间通过教育和让人们学会更小心地辨别呈现给他们的信息来推动。在2025年,网络攻击将继续变得越来越频繁和复杂。这意味着,人工智能系统在网络安全威胁造成严重破坏之前发现潜在漏洞、异常情况,以及让网络安全系统自动化等方面将变得更加重要。不过,这并不全是关于看不见的、位于幕后的算法。随着越来越多的威胁以网络钓鱼和社会工程攻击的形式出现,聊天机器人能通过模拟网络钓鱼教会我们如何发现威胁和避免成为受害者。 趋势九:量子人工智能量子计算虽然仍处于起步阶段,但它可能给人工智能带来革命性变化。量子计算利用亚原子水平上的材料表现出的奇特性,以前所未有的速度执行某些计算任务。让算法能够以亿倍于标准计算机的速度运行,不仅仅会让人工智能变得更快,它还可能完成全新的任务,在从疫苗和医药研发到新材料和新能源的生产等领域开辟新的可能性。预计在2025年,这种令人惊叹的潜力给人们带来的兴奋将开始增长! 趋势十:“可持续”的人工智能可持续人工智能包含两个因素。首先,人们越来越清楚地认识到,基于云的人工智能系统需要耗费巨大能源,我认为,我们将在数据中心看到大家齐心协力地转向可持续和可再生能源。其次,旨在提高可持续性、减少其他行业的环境足迹的人工智能应用潜力巨大。利用算法尽量减少农业用水和杀虫剂的使用,到在城市更有效地引导交通出行,以减少汽车排放造成的污染,2025年人工智能将继续让自己成为环境保护的有力工具。
  • 《普华永道最新观点:2018年人工智能技术十大趋势》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-05-11
    • 普华永道发布最新《2018年人工智能技术十大趋势》(Top 10 AI technology trends for 2018)。报告显示,我们身处一个巨变的时代,毋庸置疑,人工智能(AI)已经成为科技前沿之一,将给许多行业带来颠覆性的影响,也有可能在未来重塑公司的人才战略、运营模式以及与客户的合作模式。商业领袖都已未雨绸缪,着手研究人工智能将如何影响他们的商业战略,以防被第四次工业革命的浪潮甩在身后。 事实上,深度学习与增强学习在日常生活中的应用很多,例如机器翻译是对文本数据的处理;Siri等是对语音数据的处理;自动驾驶是对视频数据的处理;人脸识别则是对图像数据的处理,许多美颜APP都具备给图片添加可爱贴画的功能,这即是对图像进行识别,自动甄别出用户面部器官,用户即可随意处理图片,达到美化或娱乐的效果。 但是目前实验室又在发生什么呢?可以预见的是,那里的研究人员的发现将会决定人工智能未来一段时间的发展进程。普华永道人工智能加速器(AI Accelerator)研究团队和诸多技术专家及商业领袖一样,正密切关注人工智能技术的领先发展。 以下是亿欧智库带来精选推荐: 普华永道:2018年人工智能技术十大趋势 01 深度学习:揭秘神经网络的工作原理 简述:模仿人类大脑的深度神经网络展示了它们可以从图像、音频和文本数据中“学习”的能力。然而,即使应用已超过十年,关于深度学习我们仍然有很多不明白的地方,包括神经网络如何学习、为什么它们的表现如此出色等。现在,这种状况有可能会改变,这要归功于将信息瓶颈理论应用于深度学习的新理论。信息瓶颈理论认为,深度神经网络在学习过程中像把无用信息从瓶颈中挤压出去一般,去除噪音信息,而只保留这些噪音所表达的真正信息。 意义:精确地理解深度学习的工作原理,将有助于使其得到更大的发展和应用。例如,深度学习可以为网络设计优化和架构选择提供参考。可以肯定的是,通过探索深度学习理论,更多的场景应用能够被激发,并应用到其他类型的深度神经网络和深度神经网络设计中。 02 胶囊网络:模拟大脑的视觉处理优势 简述:胶囊网络是一种新型的深度神经网络架构,它能够用与大脑相同的方式处理视觉信息,这意味着它可以识别特征之间的逻辑和层次结构关系。这一特性与卷积神经网络形成鲜明对比。卷积神经网络是最广泛使用的神经网络之一,但它不能考虑简单和复杂特征之间的重要空间关系,导致错误率较高并经常出现误分类现象。 意义:对于典型的图像识别任务,胶囊网络通过减少误差,保证了50%的较高准确性,同时胶囊网络也不需要那么多的训练样本数据。预期可以看到胶囊网络在多个问题领域和深度神经网络架构中得到广泛的使用。 03 深度增强学习:交互型问题解决之道 简述:深度增强学习是一种通过观察、行动和奖励来与环境互动,从而进行学习的神经网络算法。它已被用于游戏攻略等,如雅达利(Atari)和围棋,包括击败人类冠军的著名的“阿尔法狗”(AlphaGo)等。 意义:获得深度增强学习能力是人工智能应用商业化的重要指标项之一,与其他技术相比,它只需要更少的数据来培训其模型。更强大的是,它可以通过模拟获得训练,完全不需要标签化数据。鉴于这些优势,预计未来一年将诞生更多将深度增强学习和基于智能体(agent)模拟相结合的商业应用。 04 生成对抗网络:网络配对促进训练,减轻处理负担 简述:生成对抗网络是一种由两个互相竞争的神经网络组成的无监督的深度学习系统——“生成网络”产生看上去很像真实数据集的假数据,“判断网络”吸收真实和合成的数据。随着时间的推移,每个网络都会得到改进,从而使两个网络都能够学习到给定数据集的整个分布情况。 意义:生成对抗网络进一步拓展了深度学习,使其能够处理更大范围的无监督任务,这些任务的标签化数据要么不存在,要么过于昂贵而很难获得。生成对抗网络也减少了深度神经网络所需的负载,因为负载由两个网络共同承担。预期可以看到更多的商业应用,例如使用生成对抗网络技术来做网络探测等。 05 精简和增强数据学习:解决数据标签化挑战 简述:机器学习(尤其是深度学习)遇到的最大挑战是需要大量使用标签化数据来训练系统。目前有两种广泛使用的技巧可以帮助解决这个问题:(1)合成新的数据;(2)将一个任务或领域的训练模型迁移到另一个,例如“迁移学习”的技巧(把从一个任务/领域学到的经验迁移到另一个任务/领域),或“一次学习”的技巧(极端化迁移学习,仅仅通过一个例子或没有相关例子的学习),由此使它们成为“精简数据”学习技巧。同样的,通过模拟或内插合成新的数据有助于获取更多的数据,从而扩大现有数据来改善学习。 意义:使用这些技巧,我们可以解决更多的问题,尤其是在历史数据较少的情况下。预期可以看到精简和增强数据的更多变种,以及适用于更广泛商业问题的不同类型的学习技巧。 06 概率编程:便于模型开发的语言 简述:概率编程是一种高级编程语言及建模框架,它能让开发人员便捷地设计概率模型,并且自动求解这些模型。概率编程语言可以让我们重复使用模型库,支持交互式建模以及认证,并提供必要的抽象层来更广泛和有效地推论通用模型组。 意义:概率编程框架适合的场景包括在商业领域内极为常见的不确定和不完整信息的情况。未来,我们会看到这些语言得到更广泛地应用,并期望它们也用于深度学习。 07 混合学习模式:结合算法优势解决不确定性问题 简述:不同类型的深度神经网络,譬如生成对抗网络和深度增强学习,在它们的效果和结合不同类型数据的广泛应用方面显示出巨大的前景。不过,深度学习模型不能为不确定性的数据场景建模,而贝叶斯概率方法却能够做到。混合学习模式结合了这两种方法,且能够充分利用每一种方法的优势。混合模型的一些例子包括贝叶斯深度学习,贝叶斯生成对抗网络和贝叶斯条件生成对抗网络等。 意义:混合学习模式将商业问题的种类扩大到对不确定性进行深度学习。这可以帮助我们获得更佳效果,提高模型的可解释性,从而鼓励更广泛的应用。我们将看到更多能够媲美贝叶斯法的深度学习方法,以及概率编程语言能够更好地与深度学习相融合。 08 自动机器学习:无需编程即可创建模型 简述:开发机器学习模型是一项耗时长且必须由专家驱动的工作,包括数据准备、特征选择、模型或技术选择、训练和调试等。自动机器学习旨在使用多种不同的统计学和深度学习算法来自动化这项工作。 意义:自动机器学习被视为人工智能工具“民主化”的一个部分,用户可以借助它在没有高级编程技能的情况下开发机器学习模型。这将加快数据科学家创建模型的速度。我们将看到更多的商业化自动机器学习包,以及自动机器学习与更广泛的机器学习平台的整合。 09 数字孪生体:超越工业应用的虚拟复制品 简述:数字孪生体是一种虚拟模型,用于物理或心理系统的详细分析和监测。数字孪生体的概念起源于工业界,广泛用于分析和监测诸如风电场或工业系统等。现在,通过使用基于智能体的建模(用于模拟自动智能体的行为和交互的计算模型)和系统动态学(计算机辅助的策略分析和设计方法)等,数字孪生体被广泛应用于非物理对象和流程管控中,例如预测客户行为等。 意义:数字孪生体可以帮助促进物联网(IoT)的发展和更广泛的应用,为预测性诊断和维护物联网系统提供了一种方法。展望未来,有望在实体系统和消费者选择建模中看到更多数字孪生体的使用。 10 可解释的人工智能:打开黑匣子 简述:目前,有许多机器学习算法正在使用中,它们可以在各种不同的应用场合中感知、思考和行动。然而,其中许多算法被认为是“黑匣子”,人们对于它们是如何计算出结果几乎是一无所知。可解释的人工智能意在进一步开发机器学习技巧,在产生更多可解释的模型的同时保持人工智能预测的准确性。 意义:可解释、可证明且透明的人工智能对建立技术信任至关重要,这会促进更广泛地采用机器学习技巧。我们预测,在开始大规模采用人工智能之前,企业可能会将可解释的人工智能作为一项要求或者最佳实践,与此同时,政府可能会将可解释的人工智能作为未来的一项法规要求。