《阿里云:2025年通义大模型全球下载量6亿次,衍生模型17万个》

  • 来源专题:宁夏重点产业科技信息服务
  • 编译者: 刘 悦
  • 发布时间:2025-09-28
  • 近日消息,在今日2025云栖大会上, 阿里通义大模型迎来7连发,阿里云智能首席技术官周靖人发布了多项重磅技术更新。 通义大模型在 模型智能水平、Agent工具调用和Coding能力、深度推理、多模态 等方面实现多项突破。 截至目前,通义大模型已成为全球第一开源模型,也是中国企业选择最多的模型。 当前,阿里通义开源了300余个模型,覆盖不同大小的“全尺寸”及LLM、编程、图像、语音、视频等“全模态”, 全球下载量突破6亿次,全球衍生模型17万个,稳居全球第一。 超100万家客户接入通义大模型,权威调研机构沙利文2025上半年报告显示,在中国企业级大模型调用市场中,阿里通义占比第一。 在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过GPT5、Claude Opus 4等,跻身全球前三。 Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在Chatbot Arena排行榜上位列第三,正式版性能可望再度实现突破。 Qwen3-Max是通义千问家族中最大、最强的基础模型 ,预训练数据量达36T tokens,总参数超过万亿,拥有极强的Coding编程能力和Agent工具调用能力。 下一代基础模型架构Qwen3-Next及系列模型也正式发布,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。 而在专项模型方面,千问编程模型Qwen3-Coder迎来重磅升级。 新的Qwen3-Coder与Qwen Code、Claude Code系统联合训练,应用效果显著提升,推理速度更快,代码安全性也显著提升。 其开源后调用量曾在知名API调用平台OpenRouter上激增1474%,位列全球第二。 在多模态模型中,视觉理解模型Qwen3-VL重磅开源,在视觉感知和多模态推理方面实现重大突破, 在32项核心能力测评中超过Gemini-2.5-Pro和GPT-5。 Qwen3-VL拥有极强的视觉智能体和视觉Coding能力,不仅能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务。 而全模态模型Qwen3-Omni也惊喜亮相, 音视频能力狂揽32项开源最佳性能SOTA, 可像人类一样听说写,应用场景广泛,未来可部署于车载、智能眼镜和手机等。 同时,用户还可设定个性化角色、调整对话风格,打造专属的个人IP。 而在视觉基础模型中,通义万相推出Wan2.5-preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。 通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。 视频生成时长从5秒提升至10秒,支持24帧每秒的1080P高清视频生成,并进一步提升模型指令遵循能力。 最后,通义大模型家族还迎来了全新的成员——语音大模型通义百聆,包括语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。 Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性。 Fun-CosyVoice可提供上百种预制音色,可以用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。 
  • 原文来源:http://www.199it.com/archives/1786995.html
相关报告
  • 《OpenAI CEO谈AI:中国将有独特的大模型,全球10-20个大模型能“存活”》

    • 来源专题:人工智能
    • 编译者:袁晨
    • 发布时间:2024-06-18
    • 在近日瑞士举行的2024年人工智能向善全球峰会(AI for Good Global Summit)上,OpenAI CEO山姆?奥尔特曼(Sam Altman)与《大西洋月刊》CEO尼古拉斯?汤普森(Nicholas Thompson)进行了连线交流,提及AI的全球化、安全性、合成数据训练以及下一代大模型等相关问题。 奥尔特曼在对话中预测,中国将会拥有自己独特的大语言模型,与世界其他地区的模型不同。当被问到三年后会有多少基础的大语言模型存在时,奥尔特曼表示,当下有许多模型正在训练,这种趋势将会持续,“将有成千上万的大语言模型被开发出来,但其中只有少数,如10个、20个或类似的数量,会获得大量的使用和最密集的资源投入。” 奥尔特曼认为,我们仍处在AGI的初级阶段,还有许多未知等待去探索,还有许多科学上的突破即将到来,因此在这一点上做出任何自信的预测都是非常困难的。 另一点是关于人工智能的全球化和公平问题,有人认为,GPT-4和其他大语言模型在英语、西班牙语和法语上的表现要优于斯瓦希里语(一种在非洲广泛使用的语言)等语言。奥尔特曼则回复,GPT-4o在更多种类的语言上都表现出色,OpenAI此前公布的统计数据显示,GPT-4o已经能够覆盖97%人群的母语。 关于OpenAI,近段时间备受关注的仍然是其安全性问题,在GPT-4o模型发布不久后,负责安全事务的联合创始人、首席科学家伊尔亚?苏茨克维(Ilya Sutskever)就官宣离职,而另一位在安全领域作出重大贡献的超级对齐团队联合负责人杨?莱克(Jan Leike)也离开OpenAI转投Anthropic,并在社交媒体X上称“(OpenAI)安全文化和安全流程已经让位给闪亮的产品”。 奥尔特曼在对话中表示,在确保安全性方面,模型的可解释性是一个值得探究的领域,目前尽管尚未解决可解释性问题,但他“对正在发生的许多事情感到非常兴奋”。在他看来,对模型内部运作的理解越深入,就越能做出更好的决策,“这可以成为我们构建和验证安全性声明的综合性方案的一部分。” 此外,人道科技中心联合创始人兼执行主管特里斯坦?哈里斯(Tristan Harris)曾提出一个建议是,大语言模型公司每投入100万美元用于增强模型的能力,也应同等投入100万美元用于安全性研究。奥尔特曼认为,人们往往倾向于把世界简单地划分为性能与安全两个部分,并制定一些听起来很有道理的政策,而要界定许多工作的性质是非常困难的。 如果在生产中使用一个模型,用户确实会希望它能够完成既定任务,同时不会产生任何负面影响。不过,让模型在既定的界限内,按照用户的期望去运行,是一个综合性的问题。奥尔特曼将这个过程比喻为搭乘飞机,用户期望它能安全地将自己送达目的地,同时也希望在整个飞行过程中不会出现任何故障。 “在飞机设计中,有些部分可以明确区分为能力提升或安全措施,但总体而言,我们是在努力设计一个综合系统,旨在安全、迅速地将您带到目的地,并确保飞行中不会出现任何部件脱落的问题。”奥尔特曼的观点是,有关产品能力提升和安全措施的这种界限,实际上并没有表面上看起来那么清晰。 不过,在有关安全的关键人才离开之后,OpenAI “飞机的机翼”依然稳固吗?针对公众的质疑,奥尔特曼认为,这种评价应基于公司行动,包括发布的模型、所开展的工作、进行的科学研究,实际上公司已经进行了对齐研究、建立了安全系统、实施了监控措施。 在对话中,谈及下一代模型是否会迎来指数增长的显著飞跃,奥尔特曼表示,“我们并不认为我们正处于任何指数增长的临界点。”他认为大模型仍然有很大的发展空间,并预期在某些领域将实现巨大的进步,但在其他一些领域可能提升并不如预期显著,这与之前每次模型更新时的情况相似。 训练大模型最关键的部分之一是数据,在对话中奥尔特曼提到,为了训练下一代模型,OpenAI在大量生成合成数据用以训练方面进行了各种实验。但如果训练模型的最佳途径仅仅是创造数以万亿计的合成数据并将其重新输入系统,这种方法在某种程度上显得效率不高,“应该存在一种机制,让模型在训练过程中能够更有效地从数据中学习,我认为我们还有许多问题需要解决。” 合成数据是否会引发数据出错问题?奥尔特曼认为,无论是合成数据还是人类生成的数据,都存在质量良莠不齐的问题,关键在于获取高质量的数据。只要能够收集到足够高质量的数据来训练模型,或者能够开发出提高数据效率的方法,从较少的数据量中学习更多,出错的问题是可以解决的。
  • 《阿里通义千问团队发布旗舰版模型Qwen2.5 - Max》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2025-05-15
    • 1月29日,阿里通义千问团队发布旗舰版模型Qwen2.5 - Max,该模型采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据及精心设计的后训练方案进行训练。2月4日,在Chatbot Arena三方基准测试平台的大模型盲测榜单中位列全球第七名,是非推理类的中国大模型冠军,在数学和编程等单项能力上排名第一,在硬提示方面排名第二。