《Arm与NVIDIA深化合作,Neoverse平台集成NVLink Fusion技术重塑AI数据中心架构》

  • 来源专题:新一代信息技术
  • 编译者: 刘飞
  • 发布时间:2025-11-21
  • Arm与NVIDIA宣布深化战略合作,通过将NVIDIA NVLink Fusion技术集成至Arm Neoverse平台,为AI数据中心提供全新的高性能解决方案。这一合作将率先在NVIDIA Grace Hopper及Grace Blackwell平台上实现,通过缓存一致性高带宽接口,使基于Arm架构的SoC能够与各类加速器实现无缝数据传输,有效突破AI系统的内存与带宽瓶颈。。

    随着AI数据中心对Neoverse需求的增长,客户在将工作负载加速器连接至Arm平台时有更多选择。AI模型和工作负载的指数级增长使得能耗成为性能瓶颈,高能效计算成为关键。

    为满足日益增长的需求,Arm与NVIDIA NVLink Fusion扩展Neoverse平台,将Grace Hopper及Grace Blackwell平台的性能、带宽和能效优势扩展至整个生态系统。Arm首席执行官Rene Haas表示,这一合作树立了AI基础设施的新标杆,为基于Arm平台开发的合作伙伴带来高性能体验。NVIDIA创始人兼首席执行官黄仁勋表示,NVLink Fusion作为AI时代的互连纽带,将CPU、GPU和加速器整合为统一机架级架构,通过与Arm的合作,拓展至整个Neoverse生态,助力全球创新者打造下一代专用AI基础设施。 两年前,Arm与NVIDIA通过Grace Hopper平台及NVLink技术实现了行业首创的缓存一致性集成,重新定义了高性能计算范式。为了保持创新,生态系统需要更多选择和灵活性,NVLink Fusion通过高带宽接口解决了内存与带宽瓶颈。NVIDIA NVLink Fusion专为适配Arm打造的AMBA一致性集线器接口芯片到芯片技术(CHI C2C)而设计,确保与Neoverse平台实现C2C兼容性,使系统级芯片在Arm CPU与加速器之间实现无缝数据传输。这一突破为生态合作伙伴提供了更高效的集成流程、更快的上市速度和更卓越的加速计算带宽,推动了AI时代计算架构的发展。

  • 原文来源:https://www.eetrend.com/content/2025/100596596.html
相关报告
  • 《西门子Veloce CS硬件仿真系统获Arm采用 加速Neoverse平台验证流程》

    • 来源专题:新一代信息技术
    • 编译者:张嘉璐
    • 发布时间:2025-07-30
    • 作为Veloce平台的长期用户,Arm现采用Veloce CS硬件仿真系统作为其Neoverse计算子系统(CSS)设计流程的关键环节。"在当今计算时代,上市周期正成为合作伙伴生态的核心关注点,也是保持竞争力的关键,"Arm生产力工程负责人Karima Dridi表示,"Arm Neoverse CSS的核心价值在于通过采用西门子Veloce CS等创新工具实现的预验证能力,助力合作伙伴加速芯片解决方案上市。" 西门子数字化工业软件硬件辅助验证业务副总裁Jean-Marie Brunet详解技术优势:"搭载Veloce PCIe复合设备的Veloce Strato CS提供卓越的仿真性能提升与独特的可扩展容量,而基于AMD VP1902自适应SoC的Veloce proFPGA CS则提供快速可扩展的原型设计解决方案。Veloce CS系统能全面应对硬件、软件及系统工程师面临的多样化挑战,我们与Arm的长期合作为精准把握其需求变化奠定了坚实基础。" Veloce CS系统采用模块化刀片式架构,符合现代数据中心对简易安装、超低功耗、高效散热及紧凑占地的严苛要求。Veloce proFPGA CS另提供桌面实验室版本以增强用户灵活性。具体技术优势包括: ? Veloce Strato CS:支持4000万门至400亿门级设计规模在保持高速全可视调试能力同时实现高性能仿真通过PCIe复合设备(PCD)技术集成Arm合规套件(ACS)、PCIe与NVMe协议在Veloce协议分析器支持下提供统一系统可视化调试环境? Veloce proFPGA CS:从单FPGA(VP1902)到数百FPGA的弹性扩展高性能模块化设计显著加速: ? 固件开发 ? 操作系统移植 ? 应用程序优化 ? 系统集成验证
  • 《Synopsys和Arm将合作扩展到Fusion Compiler,以加速Arm的下一代客户端和基础架构核心的实施》

    • 来源专题:集成电路
    • 编译者:Lightfeng
    • 发布时间:2019-05-12
    • 亮点: 通过使用Synopsys Fusion设计平台和采用Arm最新Cortex-A76和Neoverse N1处理器使SoC流片成功,这表明了协作优势。 Synopsys的快速启动实现工具包(Qiks)正在得到增强,可以使用Fusion Compiler为关键核心提供最佳的功率、性能和区域(PPA),包括下一代Arm处理器。 Synopsys公司(纳斯达克股票代码:SNPS)宣布,Synopsys和Arm已扩大合作,提供支持Synopsys Fusion Compiler™解决方案的快速启动实现工具包(Qiks),这是业界唯一的完全集成的RTL-to-GDSII实施系统。Fusion Compiler旨在为基于Arm®的处理器提供最快的结果时间(TTR)并提高功率性能和区域(PPA)、加速实施以实现客户的高度差异化产品,包含Arm的新产品和未来的核心架构。 这项最新工作建立在之前的合作基础之上,这些合作可让Synopsys进一步优化其基于Arm的SoC工具设计流程,从而让设计人员满足其功率、性能和区(PPA)目标,其中包含Arm的Cortex®-A76和Neoverse™N1处理器。 Fusion Compiler是Synopsys融合设计平台的最新产品,其独特的架构使设计团队能够以融合的方式实现最佳PPA,以确保最快和最可预测的TTR。Fusion Compiler部署单一,高度可扩展的数据模型并本地集成利用业界黄金签收分析工具技术的分析主干,确保在整个RTL-to-GDSII设计流程中高效,有效地优化关键PPA指标。 Fusion Compiler通过高度杠杆化和融合的优化框架实现同类最佳PPA,从而实现完全统一的物理综合和优化方法,行业领先的Synopsys技术可在整个流程中的任何位置进行部署,以实现最佳效果和最佳效果整体趋同。与使用前端和后端工具的经典组合相比,这种突破性的方法可使结果的时序质量(QoR)提高20%,总功率提高10-15%,面积提高5%。 Synopsys设计集团联合总经理Deirdre Hanford表示:“Fusion Compiler是Fusion设计平台不可或缺的一部分,提供高度差异化的解决方案,以实现Arm下一代内核所针对的应用所需的最佳PPA。”