《《通用大模型评测体系2.0》发布》

  • 编译者: 程冰
  • 发布时间:2025-10-20
  • 6月24日,认知智能全国重点实验室牵头,联合中国科学院文献情报中心、中国科学院人工智能产学研创新联盟、长三角人工智能产业链联盟发布了《通用大模型评测体系2.0》(以下简称“评测体系2.0”)。

    这是该评测体系自2023年6月发布以来的首次重大升级。“评测体系2.0”以技术迭代与产业需求为导向,在评测维度扩展、专项能力深化、评测方法优化等方面实现全面突破,为中国大模型产业发展提供更加科学的标准化支撑。

    评测任务扩展至1186项全模态覆盖引领行业前沿,相比1.0版本的7大能力维度、71类任务类型、481个细分任务,“评测体系2.0”实现了全方位升级。

    在任务规模上,“评测体系2.0”涵盖8大类、1186项细分任务,任务规模扩大至近2.5倍;在模态能力方面,从原有的文本/图片单一模态扩展至文本、图片、语音、视频全模态覆盖,新增了多模理解、多模生成、语音交互等能力评测;在语言支持上,从中文为主扩展至中英文并重,支持多语言评测,基础通用认知能力全面支持中英文双语评测。

相关报告
  • 《工业互联网体系架构2.0正式发布》

    • 来源专题:数控机床——战略政策
    • 编译者:icad
    • 发布时间:2020-07-08
    • 近两年,我国工业互联网发展已由概念普及与技术验证步入规模化推广阶段,重点行业的应用实践与创新探索持续深化,5G、人工智能等新技术也加速融入并不断拓宽工业互联网的内涵与赋能潜力。随工业互联网的深入发展,产业界急需一套具有实践借鉴意义的方法论,指导其开展工业互联网的技术创新、应用推广与生态建设。为此,工业互联网产业联盟在工业和信息化部的指导下,联合广大成员单位,历经3年时间,在2016年发布的工业互联网体系架构(版本1.0)基础上,研究制定了《工业互联网体系架构(版本2.0)》(以下简称“架构2.0”)。架构2.0于2019年10月份在联盟内发布后,获得业界广泛采纳和应用,有力推动了工业互联网的产业实践和创新发展。在进一步总结实践经验的基础上,工业互联网产业联盟现正式对外发布架构2.0。 架构2.0在继承版本1.0核心理念、要素和功能体系的基础上,从业务、功能、实施等三个角度重新定义了工业互联网的参考架构,有以下三个特点: 一是构建了由业务需求到功能定义再到实施架构的层层深入的完整体系 其核心是从工业互联网在促进产业发展中的作用与路径出发,指引企业明确自己的数字化转型商业目标与业务需求,进而确定其工业互联网的核心功能与实施框架。 二是突出数据智能优化闭环的核心驱动作用 进一步明确了工业互联网在实现物理空间与数字空间虚实交互与分析优化中的核心作用,定义了其功能层级与关键要素,以此指导企业在设备、产线、企业、产业等不同层级、不同领域构建精准决策与智能优化能力,推动产业智能化发展; 三是指导行业应用实践与系统建设 在充分考虑企业现有基础与转型需求基础上,结合国内外企业大量已开展实践的相关经验,提出网络、标识、平台和安全的实施部署方式,指导企业开展工业互联网关键系统建设和技术选型。 当前架构2.0在工业互联网应用探索中已开始发挥重要引领作用,为政府、企业、科研机构、投资者等各方提供指引和参考。一方面,一批工业互联网企业已基于架构2.0开展对标,持续完善自身技术、产品和服务能力,构建以工业互联网为核心的业务体系。另一方面,石化、钢铁、船舶等多个行业结合架构2.0,成功推进自身行业应用和系统建设,探索行业特色转型路径,引领行业整体高质量发展。同时,产业创新生态在架构2.0指引下走向壮大,5G、大数据、人工智能、区块链、边缘计算等技术创新活跃,融合型产品和解决方案不断涌现,有力支撑新兴产业与服务体系构建。 下一步,工业互联网产业联盟将继续深化和完善架构2.0内涵,联合重点行业共同开展行业架构设计、应用推广与产业生态培育,探索形成各行业工业互联网发展模式和路径,深入推进我国工业互联网创新发展。此外,联盟还将推动架构2.0与国际主流架构的对接互认,不断扩大国际影响力。
  • 《海南自主研发的农业专属大模型“穗问”2.0版发布》

    • 编译者:江浩
    • 发布时间:2025-08-22
    •        过去,干农业需要通过经验、学习来判断农作物的生长、病虫害情况。如今,依靠一部手机可能就能解决问题。近日,由海南本土企业自主研发的农业垂直领域AI大模型——“穗问”2.0版正式发布,为海南农业现代化注入数智新动能。 “穗问”2.0版由电科太极集团旗下中电科国海信通科技(海南)有限公司(以下简称电科国海信通)自主研发。据介绍,“穗问”2.0版基于电科太极的“小可”大模型研发设计,采用多智能体协同架构,具备文本理解、图像识别、语音交互、数据融合等多模态能力,整合了数百种农作物生长数据,将选种、种植、养殖、气象等农业全场景细分为精准模块,通过专家咨询及定制化服务满足农业不同环节需求,推动农业生产从“经验驱动”向“数据驱动”转型。 “过去判断病虫害,靠经验、问熟人,现在只需上传作物病虫害照片,‘穗问’即可在秒级时间内完成诊断,同步生成包含用药建议、防治周期的定制化方案,构建从识别、决策到服务的闭环,一键实现‘云问诊’。”电科国海信通技术负责人介绍。 全新升级的“穗问”2.0版病虫害识别精准度可达95%,可精准识别1000余种病虫害类型,支持农产品行情分析预测、种养方案定制、农业政策智能解读、农业法规查询、市场商机撮合等多元服务功能,同步打通生长监测、智能灌溉等硬件设备控制端口,打造手机里的“田间管家”。