在今年四月举办的的华为云生态大会2025上,华为宣布推出CloudMatrix 384超节点。基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。
制裁重压下,华为技术团队提出了“用数学补物理”、“非摩尔定律补摩尔定律”、“用系统补单点”等核心思想:基于实际可获得的芯片制造工艺,计算、存储和网络技术协同创新,开创计算架构,打造“超节点+集群”系统算力解决方案,长期持续满足算力需求。这个先进方案,让先进工艺显得不那么重要,给国内产业界带来了第二选择。
近日,华为团队和硅基流动合著了一篇题为《Serving Large Language Models on Huawei CloudMatrix384》的文章。介绍了华为 CloudMatrix。(原文链接:https://arxiv.org/pdf/2506.12708)
信息参考链接:https://mp.weixin.qq.com/s?__biz=MzkzODE1NzE1MQ==&mid=2247582868&idx=2&sn=f41c6d6f85d5b5264b6489195e34a507&scene=0#wechat_redirect