《保持冷静:新的模型设计可以解决企业的人工智能成本》

  • 来源专题:人工智能
  • 编译者: 高楠
  • 发布时间:2025-11-06
  • 由于一种新的架构设计,正在努力解决部署人工智能模型的高昂成本的企业领导者可以找到一个喘息的机会。

    虽然生成式人工智能的能力很有吸引力,但它们对训练和推理的巨大计算需求导致了高昂的费用和日益严重的环境问题。这种低效率的核心是模型的自回归过程的“基本瓶颈”,这种自回归过程一个接一个地顺序生成文本。

    对于处理大量数据流的企业,从物联网网络对于金融市场来说,这种限制使得生成长期分析既缓慢又具有经济挑战性。然而,一篇来自腾讯AI和清华大学提出替代方案。

    人工智能效率的新方法

    该研究引入了连续自回归语言模型(CALM)。这种方法重新设计了生成过程,以预测连续的矢量而不是离散的令牌。

    高保真自动编码器“将一大块K个标记压缩成一个连续的向量”,它拥有更高的语义带宽。

    这个模型不是分三步处理像“the”、“cat”、“sat”这样的东西,而是把它们压缩成一步。这种设计直接“减少了生成步骤的数量”,降低了计算负荷。

    实验结果显示了更好的性能-计算折衷。一个由四个令牌组成的冷静的人工智能模型为企业提供了“可与强大的离散基线相媲美的性能,但计算成本要低得多”。

    例如,一个平静的模型比具有类似能力的基线转换器需要的训练错误少44 %,推理错误少34%。这意味着节省了培训的初始资本费用和推理的经常性操作费用。

    为连续领域重建工具包

    从有限的、离散的词汇转移到无限的、连续的向量空间打破了标准的LLM工具包。研究人员必须开发一个“全面的无可能性框架”来使新模型可行。

    对于训练,模型不能使用标准的softmax层或最大似然估计。为了解决这个问题,该团队使用了一个带有能量转换器的“无可能性”目标,该目标在不计算显式概率的情况下奖励模型的准确预测。

    这种新的培训方法也需要新的评估标准。像困惑这样的标准基准是不适用的,因为它们依赖于模型不再计算的相同可能性。

    该团队提出了BrierLM,这是一种基于Brier分数的新度量,可以纯粹通过模型样本进行估计。验证证实了BrierLM是一个可靠的替代方案,显示了与传统损失指标的“Spearman等级相关性为-0.991”。

    最后,框架恢复了受控生成,这是企业使用的一个关键特性。没有概率分布,标准温度采样是不可能的。该论文介绍了一种新的“无似然采样算法”,包括一种实用的批量近似方法,以管理输出精度和多样性之间的权衡。

    降低企业人工智能成本

    这项研究让我们看到了未来,生成式人工智能不再纯粹由越来越大的参数数来定义,而是由建筑效率来定义。

    目前的模式扩展之路正在遭遇收益递减和成本上升的困境。CALM框架建立了一个“LLM扩展的新设计轴:增加每个生成步骤的语义带宽”。

    虽然这是一个研究框架,而不是现成的产品,但它指出了一条通向超高效语言模型的强大且可扩展的途径。在评估供应商路线图时,技术领导者应该超越模型大小,开始询问架构效率。

    减少每个生成令牌的FLOPs的能力将成为一个决定性的竞争优势,使人工智能能够在整个企业中更经济、更可持续地部署,以降低成本——从数据中心到数据密集型边缘应用。

  • 原文来源:https://www.artificialintelligence-news.com/news/keep-calm-new-model-design-fix-high-enterprise-ai-costs/
相关报告
  • 《保持冷静:新的模型设计可以解决企业的人工智能成本》

    • 来源专题:宁夏重点产业信息监测
    • 编译者:高楠
    • 发布时间:2025-11-06
    • 由于一种新的架构设计,正在努力解决部署人工智能模型的高昂成本的企业领导者可以找到一个喘息的机会。 虽然生成式人工智能的能力很有吸引力,但它们对训练和推理的巨大计算需求导致了高昂的费用和日益严重的环境问题。这种低效率的核心是模型的自回归过程的“基本瓶颈”,这种自回归过程一个接一个地顺序生成文本。 对于处理大量数据流的企业,从物联网网络对于金融市场来说,这种限制使得生成长期分析既缓慢又具有经济挑战性。然而,一篇来自腾讯AI和清华大学提出替代方案。 人工智能效率的新方法 该研究引入了连续自回归语言模型(CALM)。这种方法重新设计了生成过程,以预测连续的矢量而不是离散的令牌。 高保真自动编码器“将一大块K个标记压缩成一个连续的向量”,它拥有更高的语义带宽。 这个模型不是分三步处理像“the”、“cat”、“sat”这样的东西,而是把它们压缩成一步。这种设计直接“减少了生成步骤的数量”,降低了计算负荷。 实验结果显示了更好的性能-计算折衷。一个由四个令牌组成的冷静的人工智能模型为企业提供了“可与强大的离散基线相媲美的性能,但计算成本要低得多”。 例如,一个平静的模型比具有类似能力的基线转换器需要的训练错误少44 %,推理错误少34%。这意味着节省了培训的初始资本费用和推理的经常性操作费用。 为连续领域重建工具包 从有限的、离散的词汇转移到无限的、连续的向量空间打破了标准的LLM工具包。研究人员必须开发一个“全面的无可能性框架”来使新模型可行。 对于训练,模型不能使用标准的softmax层或最大似然估计。为了解决这个问题,该团队使用了一个带有能量转换器的“无可能性”目标,该目标在不计算显式概率的情况下奖励模型的准确预测。 这种新的培训方法也需要新的评估标准。像困惑这样的标准基准是不适用的,因为它们依赖于模型不再计算的相同可能性。 该团队提出了BrierLM,这是一种基于Brier分数的新度量,可以纯粹通过模型样本进行估计。验证证实了BrierLM是一个可靠的替代方案,显示了与传统损失指标的“Spearman等级相关性为-0.991”。 最后,框架恢复了受控生成,这是企业使用的一个关键特性。没有概率分布,标准温度采样是不可能的。该论文介绍了一种新的“无似然采样算法”,包括一种实用的批量近似方法,以管理输出精度和多样性之间的权衡。 降低企业人工智能成本 这项研究让我们看到了未来,生成式人工智能不再纯粹由越来越大的参数数来定义,而是由建筑效率来定义。 目前的模式扩展之路正在遭遇收益递减和成本上升的困境。CALM框架建立了一个“LLM扩展的新设计轴:增加每个生成步骤的语义带宽”。 虽然这是一个研究框架,而不是现成的产品,但它指出了一条通向超高效语言模型的强大且可扩展的途径。在评估供应商路线图时,技术领导者应该超越模型大小,开始询问架构效率。 减少每个生成令牌的FLOPs的能力将成为一个决定性的竞争优势,使人工智能能够在整个企业中更经济、更可持续地部署,以降低成本——从数据中心到数据密集型边缘应用。
  • 《中国大学推出新的农业人工智能模型》

    • 来源专题:农机装备
    • 编译者:江浩
    • 发布时间:2025-10-14
    • 中国农业大学 (CAU) 周一在北京举行的 3.0 年世界农业食品创新大会 (WAFI 2025) 上推出了神农大模型 2025,标志着人工智能在农业中更容易获得和实用化方面迈出了重要一步。 据 CAU 首席研究员王耀军介绍,一项关键成就是,与原始版本相比,这种新模型不仅大幅降低了计算需求,而且性能提高了 5%。 他补充说,该模型的架构经过全面重新设计,以在轻量化和高性能之间取得最佳平衡。 此最新版本建立在早期版本奠定的关键基础之上。神农 1.0 建立了农业核心知识和问答能力,而神农 2.0 引入了多模态功能,将模型的应用扩展到整个农业领域。 该模型的命名是为了纪念神农,神农是中国神话中一位受人尊敬的人物,被称为“神农”,他因教授中国古代人民农业实践和药材使用而受到赞誉。 除了大模型,团队还发布了一个代理平台。该平台培育了一个覆盖整个农业链的轻量级、可部署和协作的人工智能生态系统,提供 36 个专业代理,分为智能育种、种植和养殖六大类。 “这些智能体专为 36 种不同的农业场景而设计,可以与农业机械和传感器集成,以增强农业智能生产,”王说。 他指出,试点项目已经在北京周边的多个地区以及中国北部的内蒙古自治区和中国东北的黑龙江省部署,在整个种植过程中提供植保和定制指导等本地化服务。 王先生补充说,神农大模型3.0的推出标志着农业人工智能进入了一个新阶段的到来,该阶段以高效、用户友好和技术自立为特征,从而为智慧农业的未来奠定了坚实的基础。 神农大模型自 2023 年问世以来,已在广泛且专业化的农业数据集上进行了训练,集成了超过 1000 万张农业知识图谱、5000 万条现代农业生产数据记录和 20000 部农业专著。 WAFI 2025 于 10 月 12 日至 14 日举行,汇聚了来自国内外的约 780 名专家,是致力于推动全球农业食品创新的世界级平台。