《全球超算Top500发榜,日本「富岳」蝉联冠军,中美两国持续霸榜》

  • 来源专题:科技大数据监测服务平台
  • 编译者: luby
  • 发布时间:2020-11-24
  • 全球超算Top500第56期新榜单公布,来自日本的超级计算机「富岳」再次蝉联第一,亚军和季军均为美国的超级计算机。来自中国的「神威·太湖之光」超级计算机位列第4位,「天河2A」位列第6位。

    最近,TOP500超级计算机排名最新出炉。日本超算富岳Fugaku再次搭载ARM芯片夺冠!

    不过,虽然日本的Fugaku超算巩固了它在榜单中的第一位置,但与此同时,本次排名榜单也反映了一个平坦的性能增长曲线。

    第二名Summit,是IBM在田纳西州橡树岭国家实验室(ORNL)建造的系统,以148.8 PetaFLOPS的性能保持着美国最快的系统。拥有4356个节点,每个节点都容纳了两个22核Power9 CPU和6个NVIDIA Tesla V100 GPU。

    第三名是位于加利福尼亚州劳伦斯-利弗莫尔国家实验室的系统Sierra,以94.6 PetaFLOPS的HPL排名第三。其架构与Summit非常相似,其4320个节点中的每个节点都配备了两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU。

    本次新上榜的JUWELS Booster Module位列榜单第七。JUWELS Booster Module单独运行时能够达到44.1 HPL PetaFLOPS,使其成为欧洲最强大的系统。

    本次排名第十的Dammam-7安装在沙特阿拉伯的沙特阿美公司,是目前前十名中的第二台商用超级计算机,也是前十里第二台新上榜的机器。它采用英特尔Xeon Gold CPU和NVIDIA Tesla V100 GPU,在HPL基准上达到了22.4 PetaFLOPS。

    富岳:以富士山的别名命名,搭载ARM芯片且创造新纪录

    曾在2011年的时候,日本凭借K(京)超级计算机拿下了TOP500冠军,是世界上第一台每秒执行10万亿次运算的超级计算机,使用的是日本富士通研发的SPARC64处理器。去年,K超算退役。

    Fugaku富岳超算由日本理化研究所联合富士通打造,此前的代号Post-K,也就是京超算后一代的意思,最终以富士山的别名正式命名为Fugaku。

    值得注意的是这台超级计算机竟然是基于ARM架构的,这也是TOP500排行榜里首个采用ARM芯片的超级计算机。

    从传统观念来看,ARM是移动芯片,性能比较低。目前,多数超级计算机仍然采用的是英特尔和AMD的芯片组。

    与现有超算相比,这代超算最大的变化就是采用ARM架构,由富士通的48核A64FX SoC提供支持。

    富岳Fugaku的目标是要比上一代京计算机强100倍(即性能目标为1 exaflop) ,并在世界上具有高度的实用性。Fugaku使用了158,976个 A64FX处理器,使用富士通专有的环面融合互连技术连接在一起。

    Fugaku超算最大的变化就是CPU采用了ARM架构,峰值浮点性能高达 537PFLOPS(53.7亿亿次),Rmax性能为442PFLOPS(PFLOPS指的是每秒1千万亿次浮点运算),是第二名超算 Summit的近3倍,不过功耗也达到了29MW,也是Summit的接近3倍。

    同时,富岳拥有442 PetaFLOPS,这也创造了新的世界纪录,使其领先榜单中排名第二的系统三倍。

    目前Fugaku超算的性能还不是完整版,后续还会继续升级到1000PFLOPS,也就是百亿亿次,最终要在2021年左右投入使用。

    据理化研究所称,除了运算速度,Fugaku在其他三个部门也是第一,成为全球首个获得「四项冠军」。其他三个部门是产业方面利用较多的计算手法性能,用于AI领域的计算性能,以及成为大数据解析指标的解析性能。

    超算TOP500榜单

    TOP500项目是针对全球已知最强大的计算机系统做出排名与详细介绍。此项目始于1993年并且一年出版两次最新的超级计算机排名列表。

    每年的第一次排名公布总是在6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算会议上。此项目主旨在提供一个可靠的基础去追踪与侦测高性能计算的趋势。

    从上图可以看出,截至2019年11月,所有TOP500超级计算机全部为64位,大部分是基于x86-64的CPU(英特尔的EMT64和AMD的AMD64指令集架构),只有少数是基于精简指令集(RISC),其中有13台基于IBM POWER微处理器的超级计算机使用Power架构,有6台基于富士通设计的HAL SPARC64芯片。

    另外,还有少数计算机使用了另一种非美国设计,即基于ARM架构的PEZY-SC,它是与英特尔Xeon配对的加速器。

    中国超算总数实力霸榜

    Top500排行榜目前依然是由中国和美国的超级计算机主导 , 美国开发的另一台超级计算机Sierra排名第3,而中国的「神威·太湖之光」和「天河2A」分别排在第4和第6位。

    中国长期以来在超算领域保持优势,对美国政府和研究机构触动很大,也促使美国加大投入研发新一代超级计算机。

    为何各国要以举国之力研制新超算?

    有专家曾介绍说,无论是的国防、材料科学、天文学,还是距离我们生活更近的天气预报、灾害监测、交通管理,超算都大有用武之地。

    在抗击新冠疫情的过程中,各国超算也都倾尽全力。

    中国「天河二号」超算协助搭建起「15秒断诊」的新冠CT影像智能诊断平台,并助力筛选能抑制病毒的小分子药物。美国Summit超算同样参与到新药研制中,模拟新冠病毒与不同化合物的反应。此次夺冠的日本Fugaku超算也为探索新药启动了试验。

    由中国国家并行计算机工程技术研究中心(NRCPC)开发的「神威·太湖之光」排名第四。该系统完全由 Sunway 260核 SW26010处理器提供动力。2016年6月在中国无锡国家超级计算机中心安装,HPL性能为93 petaflops。

    由中国国防科技大学开发的「天河2A」排名第6。它是采用Intel至强CPU和定制的 Matrix-2000协处理器的混合架构,HPL性能为61.4petaflop,目前部署在中国广州的国家超级计算机中心。

    尽管本次公布的 Top500 排名榜单有两个新的系统进入了前10名,但是完整的名单记录了自1993年该项目开始以来最少的新项目。

    或许传统的超算已经开始进入一个拐点的时刻,新兴的智能超算和未来的量子霸权也许会开启崭新的时代。

  • 原文来源:https://mp.weixin.qq.com/s/2VAhS7VdZcyLEcEUe5WaXQ
相关报告
  • 《全球超算TOP500最新排名:搭载ARM日本超算Fugaku首次夺冠!中国超算总数实力霸榜》

    • 来源专题:科技大数据监测服务平台
    • 编译者:zhoujie
    • 发布时间:2020-06-24
    • 最近,TOP500超级计算机排名最新出炉。日本超算Fugaku首次搭载ARM芯片夺冠! 目前,世界十大超级计算机中有八台使用 NVIDIA GPU、 InfiniBand 网络或两者都有使用。这些超级计算机是美国、欧洲和中国最强大的计算系统。按国家划分,中国持续占据500强的主导地位,共有226台超级计算机上榜。美国排名第二,有114套超算上榜。日本排名第三,有30套系统;法国有18套系统;德国有16套系统。美国在数量方面排名第二,但总体运算速度仍然超过中国,为每秒644千兆次浮点运算,中国为每秒565千兆次浮点运算。日本的系统可以提供530千兆次的浮点运算。 英伟达GPU占据TOP500超级计算机三分之二,能耗大幅降低 英伟达目前已与 Mellanox 合并,在最新榜单上占据了 TOP500 系统总数的三分之二(333) 。 在 TOP500排名前25的超级计算机中,有20台使用了 NVIDIA GPU。 英伟达Selene美国最快的工业系统,绿色500检测排名第二。 Nvidia Selene 系统以领先的能源效率成为美国最快的工业系统! 在能源效率方面,使用 NVIDIA GPU的系统脱颖而出。与没有搭载 NVIDIA GPU(以千兆次浮点运算 / 瓦特为单位)的系统相比,能源效率平均提高了2.8倍。 这种能源效率的最好例子是 Selene系统,它是 NVIDIA 内部研究集群的最新成员。该系统在最新的 Green500名单上(能源效率排名)排名第二,在 Linpack 基准测试中以27.5 petaflops在TOP500榜单中排名第七。 Selene的功耗为20.5 gigaflops/watt,与Green500榜单上的第一名相差甚微,但排名第一的系统体积更小,其性能表现仅排在第394位。 Selene 是唯一一个突破20gigaflops/watt 大关的100强系统。它也是世界上第二强大的工业超级计算机,仅次于意大利能源巨头埃尼集团公司的第6号系统,该系统也使用 NVIDIA GPU。 Nvidia GPU正在为TOP500超级计算机提高能源效率。 在节能方面,Selene 的效率是没有使用 NVIDIA GPU的 TOP500 系统的6.8倍。Selene 的性能和能源效率得益于 NVIDIA A100 GPU的第三代张量核,它加快了传统64位模拟的速度,降低了 AI 的精度。 Selene系统仅仅花了不到四周就建立起来了。因为工程师使用 NVIDIA 的模块化参考架构。便能够快速组装 Selene。 此前在英伟达GTC 2020上发布的DGX A100是一个敏捷的系统,它在一个 6U 服务器上安装了8个 A100 GPU 和 NVIDIA Mellanox HDR InfiniBand 网络。它的创建是为了加速高性能计算、数据分析和人工智能工作(包括培训和推理)的组合,并能快速部署。 日本超算Fugaku跃居第一,首次搭载ARM芯片 6月23日这一天对英特尔来说真不是好日子。 苹果在WWDC发布会上正式宣布将在Mac电脑上采用ARM SoC芯片。无独有偶,在最新的TOP500超算排名中,使用48核ARM芯片的日本Fugaku超算位列世界第一。 曾在2011年的时候,日本凭借K超级计算机拿下了TOP500冠军,是世界上第一台每秒执行10万亿次运算的超级计算机,使用的是日本富士通研发的SPARC64处理器。去年,K超算退役。 Fugaku超算由日本理化研究所联合富士通打造,此前的代号叫Post-K,也就是京超算后一代的意思,最终以富士山的名字正式命名为Fugaku。 Fugaku超算最大的变化就是CPU采用了ARM架构,峰值浮点性能高达513PFLOPS(51.3亿亿次),Rmax性能为415.5PFLOPS(PFLOPS指的是每秒1千万亿次浮点运算),是第二名超算Summit的2.8倍,不过功耗也达到了28MW,是Summit的2.8倍。 值得注意的是这台超级计算机竟然是基于ARM架构的,这也是 TOP500 排行榜里首个采用ARM芯片的超级计算机。 从传统观念来看,ARM是移动芯片,性能比较低。目前,多数超级计算机仍然采用的是英特尔和AMD的芯片组。 与现有超算相比,这代超算最大的变化就是采用ARM架构,由富士通的48核A64FX SoC提供支持。 Fugaku超算的浮点部分是与ARM合作的SVE指令扩展,使用了512bit浮点运算单元,每个节点使用48核+4辅助核,IO及计算节点则是48核+4辅助核结构。 性能最好的Fugaku 超级计算机在此次Green500上排名第九,每瓦能进行14.67 gigaflops 运算。它的功率效率仅次于Summit的14.72 gigaflops/watt。 而目前Fugaku超算的性能还不是完整版,后续还会继续升级到1000PFLOPS,也就是百亿亿次,最终要在2021年左右投入使用。 据理化研究所称,除了运算速度,Fugaku在其他三个部门也是第一,成为全球首个获得「四项冠军」。其他三个部门是产业方面利用较多的计算手法性能,用于AI领域的计算性能,以及成为大数据解析指标的解析性能。 中国超算总数实力霸榜,联想继续蝉联全球最强超算供应商 Top500排行榜目前依然是由中国和美国的超级计算机主导 ,美国开发的另一台超级计算机Sierra排名第三,而中国的「神威·太湖之光」和「天河2A」分别排在第四和第五位。 中国长期以来在超算领域保持优势,对美国政府和研究机构触动很大,也促使美国加大投入研发新一代超级计算机。 为何各国要以举国之力研制新超算? 有专家曾介绍说,无论是的国防、材料科学、天文学,还是距离我们生活更近的天气预报、灾害监测、交通管理,超算都大有用武之地。 在最近抗击新冠疫情的过程中,各国超算也都倾尽全力。 中国「天河二号」超算协助搭建起「15秒断诊」的新冠CT影像智能诊断平台,并助力筛选能抑制病毒的小分子药物。美国Summit超算同样参与到新药研制中,模拟新冠病毒与不同化合物的反应。此次夺冠的日本Fugaku超算也为探索新药启动了试验。 由中国国家并行计算机工程技术研究中心(NRCPC)开发的「神威·太湖之光」排名第四。该系统完全由 Sunway 260核 SW26010处理器提供动力。2016年6月在中国无锡国家超级计算机中心安装,HPL性能为93 petaflops。 由中国国防科技大学开发的「天河2A」排名第五。它是采用 Intel 至强 CPU 和定制的 Matrix-2000协处理器的混合架构,HPL性能为61.4petaflop,目前部署在中国广州的国家超级计算机中心。 在全球浮点运算性能TOP500超算中,联想有180台超级计算机入围榜单,较上份榜单的173台增加7台,数量远超其他厂商,再次名列全球高性能超算供应商的第一名。另外,曙光68台,浪潮64台,中国制造商合计占312台。
  • 《全球超算500强新榜发布:美国卫冕 中国力争》

    • 来源专题:科技大数据监测服务平台
    • 编译者:dingxq
    • 发布时间:2018-11-14
    • 北京时间12日,每半年发布一次的全球超级计算机500强榜单在美国达拉斯发布新一期排名。国际组织“TOP500”网站显示,美国能源部下属橡树岭国家实验室开发的“顶点”(Summit)蝉联冠军,扩大了领先优势。中国以227台超算上榜的成绩位居总数第一,较上期增加21台。 观察者网注意到,新榜单披露,“顶点”浮点运算速度从半年前的每秒12.23亿亿次增加到每秒14.35亿亿次;上期名列第三、由美能源部下属劳伦斯利弗莫尔国家实验室开发的“山脊”(Sierra),晋级亚军。前10名中,美国占据5台。 中国超算“神威·太湖之光”和“天河二号”分别位列第三、四名。