《随着Arm HPC生态系统的发展,Fugaku再次荣登超级计算机排名榜首》

  • 来源专题:集成电路
  • 编译者: Lightfeng
  • 发布时间:2020-11-30
  • 由日本理研社和富士通联合开发的基于Arm技术的超级计算机Fugaku再次荣登超算Top 500榜首,这进一步凸显了快速发展的高性能计算对需求,Arm 技术通过能源效率、性能和可扩展性实现了无可匹敌的组合,解决了这一需求。

    除了RIKEN和Fujitsu的出色表现之外,基于Arm的解决方案被越来越多的生态系统采用。大韩民国国家计算机研究所ETRI最近宣布,计划在其K-AB21系统中采用即将推出的neoversev1(以前的代号为Zeus)CPU设计,该设计具有Arm可扩展矢量扩展(SVE)功能。ETRI的目标是AB 21(Artificial Brain 21),即每个CPU 16teraflops和每机架1600teraflops,同时将功耗比目标降低60%。

    与此同时,在本月早些时候举行的Arm高性能计算用户组(AHUG)会议上,Ampere Computing、桑迪亚国家实验室、布里斯托大学和亚马逊网络服务(AWS)提供了其基于Arm的HPC计划的详细信息。在SC20活动中,由欧洲处理器倡议组织(European Processor Initiative)成立的公司SiPearl也将申请采用Neoverse V1作为其Rhea处理器,这是SiPearl exascale计算项目的一部分。NVIDIA还宣布,研究人员通过NVIDIA A100 GPU和基于Arm Neoverse的Ampere Altra CPU,将HPC的性能提高近26倍。

    许多新的基于Arm的解决方案的影响还处于初期,Fugaku在COVID-19相关研究工作中所产生的积极影响值得自豪。尽管Fugaku仅在几个月前正式启动,但已被部署到五个不同的COVID-19研究项目中,其中一个研究病毒在空中的传播方式,另一个研究2000多种现有药物的功效。

    这些计划已经进行了多年,最终旨在解决HPC反复出现的挑战之一:如何在不超出合理功率和预算范围的前提下扩展构建一个新的性能高度的系统。Arm处理器体系结构背后的中心思想之一为,单线程、多核处理器将成为超级计算机CPU的新规范,以此作为在不增加相对功率的情况下提高性能的一种方式。

    Arm高性能计算高级总监Brent Gorda表示:“今年是Arm HPC的分水岭。从我们十年前在服务器SoC设计方面的拙劣开端到两次被评为世界顶级超级计算机,Arm的旅程意义非凡。在全球范围内,我们看到对Arm生态系统的需求和投资正在持续,我们已经准备好应对这一挑战,我们期待着未来十年,可以拥有真正改变世界的技术。”

相关报告
  • 《Arm为AI超级计算的发展铺平道路》

    • 来源专题:集成电路
    • 编译者:Lightfeng
    • 发布时间:2019-11-24
    • Arm和创新生态系统构建者将共同努力提供技术和解决方案,在2035年实现上万亿个设备上线的目标。Arm仍将继续推动AI、5G、计算基础和物联网的融合,推动从云到边缘的数据消费模型的巨大变化。如今,Arm已成为建立AI和HPC创新平台,从最大的集群扩展到新兴的边缘。 今年初,NVIDIA宣布对Arm CPU的支持加大力度,并将其完整的AI和HPC软件堆栈提供给Arm合作伙伴平台,这对于两家公司来很重要。NVIDIA GPU为世界高端的超级计算机提供动力,其中包括Oak Ridge国家实验室最快的Summit。这些系统将在未来的百亿亿次超级计算中发挥重要作用,超级计算机的运行速度将是当今最佳速度的5倍到10倍,但要这需要高性能水平的硬件设施作为基础。 Arm和NVIDIA都了解生态系统,并且非常擅长构建用户所需的软件堆栈。NVIDIA GPU与Arm处理器无缝运行可以为Arm的HPC合作伙伴和NVIDIA市场领先的ML / AI技术提供更多的市场机会。这项重要的合作彰显了Arm想要实现从数据中心到边缘的高效计算的愿景。 NVIDIA介绍了一项技术蓝图,可以使公司快速轻松地构建GPU加速的基于Arm的服务器。该参考平台由硬件和软件构建块组成,旨在在整个科学研究领域的快速增长的应用程序中实现更高性能的计算。NVIDIA的CUDA加速计算与Arm的高能效CPU架构相结合,将为HPC社区提供先进工具和技术,以实现从边缘到最大的HPC部署。Arm正在努力在HPC空间中部署Arm技术,并且试法解决世界上一些最复杂的研究挑战。
  • 《全球超算TOP500最新排名:搭载ARM日本超算Fugaku首次夺冠!中国超算总数实力霸榜》

    • 来源专题:科技大数据监测服务平台
    • 编译者:zhoujie
    • 发布时间:2020-06-24
    • 最近,TOP500超级计算机排名最新出炉。日本超算Fugaku首次搭载ARM芯片夺冠! 目前,世界十大超级计算机中有八台使用 NVIDIA GPU、 InfiniBand 网络或两者都有使用。这些超级计算机是美国、欧洲和中国最强大的计算系统。按国家划分,中国持续占据500强的主导地位,共有226台超级计算机上榜。美国排名第二,有114套超算上榜。日本排名第三,有30套系统;法国有18套系统;德国有16套系统。美国在数量方面排名第二,但总体运算速度仍然超过中国,为每秒644千兆次浮点运算,中国为每秒565千兆次浮点运算。日本的系统可以提供530千兆次的浮点运算。 英伟达GPU占据TOP500超级计算机三分之二,能耗大幅降低 英伟达目前已与 Mellanox 合并,在最新榜单上占据了 TOP500 系统总数的三分之二(333) 。 在 TOP500排名前25的超级计算机中,有20台使用了 NVIDIA GPU。 英伟达Selene美国最快的工业系统,绿色500检测排名第二。 Nvidia Selene 系统以领先的能源效率成为美国最快的工业系统! 在能源效率方面,使用 NVIDIA GPU的系统脱颖而出。与没有搭载 NVIDIA GPU(以千兆次浮点运算 / 瓦特为单位)的系统相比,能源效率平均提高了2.8倍。 这种能源效率的最好例子是 Selene系统,它是 NVIDIA 内部研究集群的最新成员。该系统在最新的 Green500名单上(能源效率排名)排名第二,在 Linpack 基准测试中以27.5 petaflops在TOP500榜单中排名第七。 Selene的功耗为20.5 gigaflops/watt,与Green500榜单上的第一名相差甚微,但排名第一的系统体积更小,其性能表现仅排在第394位。 Selene 是唯一一个突破20gigaflops/watt 大关的100强系统。它也是世界上第二强大的工业超级计算机,仅次于意大利能源巨头埃尼集团公司的第6号系统,该系统也使用 NVIDIA GPU。 Nvidia GPU正在为TOP500超级计算机提高能源效率。 在节能方面,Selene 的效率是没有使用 NVIDIA GPU的 TOP500 系统的6.8倍。Selene 的性能和能源效率得益于 NVIDIA A100 GPU的第三代张量核,它加快了传统64位模拟的速度,降低了 AI 的精度。 Selene系统仅仅花了不到四周就建立起来了。因为工程师使用 NVIDIA 的模块化参考架构。便能够快速组装 Selene。 此前在英伟达GTC 2020上发布的DGX A100是一个敏捷的系统,它在一个 6U 服务器上安装了8个 A100 GPU 和 NVIDIA Mellanox HDR InfiniBand 网络。它的创建是为了加速高性能计算、数据分析和人工智能工作(包括培训和推理)的组合,并能快速部署。 日本超算Fugaku跃居第一,首次搭载ARM芯片 6月23日这一天对英特尔来说真不是好日子。 苹果在WWDC发布会上正式宣布将在Mac电脑上采用ARM SoC芯片。无独有偶,在最新的TOP500超算排名中,使用48核ARM芯片的日本Fugaku超算位列世界第一。 曾在2011年的时候,日本凭借K超级计算机拿下了TOP500冠军,是世界上第一台每秒执行10万亿次运算的超级计算机,使用的是日本富士通研发的SPARC64处理器。去年,K超算退役。 Fugaku超算由日本理化研究所联合富士通打造,此前的代号叫Post-K,也就是京超算后一代的意思,最终以富士山的名字正式命名为Fugaku。 Fugaku超算最大的变化就是CPU采用了ARM架构,峰值浮点性能高达513PFLOPS(51.3亿亿次),Rmax性能为415.5PFLOPS(PFLOPS指的是每秒1千万亿次浮点运算),是第二名超算Summit的2.8倍,不过功耗也达到了28MW,是Summit的2.8倍。 值得注意的是这台超级计算机竟然是基于ARM架构的,这也是 TOP500 排行榜里首个采用ARM芯片的超级计算机。 从传统观念来看,ARM是移动芯片,性能比较低。目前,多数超级计算机仍然采用的是英特尔和AMD的芯片组。 与现有超算相比,这代超算最大的变化就是采用ARM架构,由富士通的48核A64FX SoC提供支持。 Fugaku超算的浮点部分是与ARM合作的SVE指令扩展,使用了512bit浮点运算单元,每个节点使用48核+4辅助核,IO及计算节点则是48核+4辅助核结构。 性能最好的Fugaku 超级计算机在此次Green500上排名第九,每瓦能进行14.67 gigaflops 运算。它的功率效率仅次于Summit的14.72 gigaflops/watt。 而目前Fugaku超算的性能还不是完整版,后续还会继续升级到1000PFLOPS,也就是百亿亿次,最终要在2021年左右投入使用。 据理化研究所称,除了运算速度,Fugaku在其他三个部门也是第一,成为全球首个获得「四项冠军」。其他三个部门是产业方面利用较多的计算手法性能,用于AI领域的计算性能,以及成为大数据解析指标的解析性能。 中国超算总数实力霸榜,联想继续蝉联全球最强超算供应商 Top500排行榜目前依然是由中国和美国的超级计算机主导 ,美国开发的另一台超级计算机Sierra排名第三,而中国的「神威·太湖之光」和「天河2A」分别排在第四和第五位。 中国长期以来在超算领域保持优势,对美国政府和研究机构触动很大,也促使美国加大投入研发新一代超级计算机。 为何各国要以举国之力研制新超算? 有专家曾介绍说,无论是的国防、材料科学、天文学,还是距离我们生活更近的天气预报、灾害监测、交通管理,超算都大有用武之地。 在最近抗击新冠疫情的过程中,各国超算也都倾尽全力。 中国「天河二号」超算协助搭建起「15秒断诊」的新冠CT影像智能诊断平台,并助力筛选能抑制病毒的小分子药物。美国Summit超算同样参与到新药研制中,模拟新冠病毒与不同化合物的反应。此次夺冠的日本Fugaku超算也为探索新药启动了试验。 由中国国家并行计算机工程技术研究中心(NRCPC)开发的「神威·太湖之光」排名第四。该系统完全由 Sunway 260核 SW26010处理器提供动力。2016年6月在中国无锡国家超级计算机中心安装,HPL性能为93 petaflops。 由中国国防科技大学开发的「天河2A」排名第五。它是采用 Intel 至强 CPU 和定制的 Matrix-2000协处理器的混合架构,HPL性能为61.4petaflop,目前部署在中国广州的国家超级计算机中心。 在全球浮点运算性能TOP500超算中,联想有180台超级计算机入围榜单,较上份榜单的173台增加7台,数量远超其他厂商,再次名列全球高性能超算供应商的第一名。另外,曙光68台,浪潮64台,中国制造商合计占312台。