第58届top500榜单前10名中仅有一台新系统上榜,为voyager-eus2。该系统是microsoft azure系统,排名第10位。日本超级计算机fugaku位居榜首,其他系统排名也与上届相同,与上届相比有变化的是第5的系统perlmutter,性能从之前的64.6pflop/s提升至70.9pflop/s。
文章内容参考自“《第58届全球超级计算机top500排名及分析》”和“《第57届全球超级计算机top500排名及分析》”。
1、aiperf:大规模人工智能算力基准测试程序
2、ai高性能:云边端硬件部署实践
top10榜单情况介绍及分析
系统fugaku保持第一位,拥有7630848个核心,性能达到442pflop/s,为排名第2的summit(顶点)linpack性能的3倍。该系统采用富士通定制的arm a64fx处理器。 summit(顶点)是美国田纳西州橡树岭国家实验室(ornl)由ibm构建系统,它仍然是美国最快的系统,在 hpl 基准测试中的性能为148.8pflop/s,在全球排名第二。它拥有 4,356 个节点,每个节点包含两个power9cpu,每个cpu有22个内核,六个nvidia tesla v100 gpu。这些节点通过mellanox双轨 edr infiniband 网络连接在一起。 美国加利福尼亚州劳伦斯利弗莫尔国家实验室(linl)的 sierra 系统排名第3。其架构与#2系统summit非常相似。它由4,320个节点构成,具有两个power9cpu和四个nvidia tesla v100gpu。hpl性能达到了94.6pflop/s。
由中国国家并行计算机工程与技术研究中心(nrcpc)开发并安装在中国江苏省无锡国家超级计算中心的系统神威太湖之光以93pflop/s排名第四。 perlmutter为本届top10中新上榜系统,该机器基于hpe cray“ shasta”平台,配置amd epyc 7763 处理器和nvidia a100加速部件,相比上一届性能有所提升,实现了70.9 pflop/s的linpack性能,依旧排名第5位。 selene现在排名第6,是美国nvidia内部安装的 nvidia dgx a100 superpod。
该系统基于amd epyc处理器,采用nvidiaa100加速,mellanoxhdr infiniband作为网络互连,实现了63.4pflop/s。 由中国国防科技大学(nudt)开发并部署在中国广州国家超级计算机中心的系统天河2a(milky way-2a)以61.4pflop/s的性能排名第7,配备英特尔至强处理器和定制的matrix-2000加速器。 名为“ juwels booster module”的系统排名第8。由atos构建的bull sequana系统安装在德国的forschungszentrum juelich (fzj)。
该系统采用amd epyc处理器和nvidia a100进行加速,并使用网络,类似于selene系统。这个系统是欧洲最强大的系统,性能达到44.1pflop/s。 排名第9位的hpc5是戴尔构建、意大利eni s.p.a公司安装的poweredge系统,由于使用nvidia teslav100作为加速器,使用mellanox hdr infiniband作为网络,实现了35.5 pflop/s的性能。 微软的voyager-eus2系统新上榜排名第10,性能为30.05pflop/s,采用48核心的amd epyc处理器,配置80gb显存的nvidia a100 gpu加速卡和mellanox hdr infiniband网络。
榜单总体分析
中国系统保有量再居第一,美国系统装机量上升。本届榜单500台系统中,中国的超级计算系统装机数量为173台,占34.6%,位居第一位;美国其次,系统保有量为149台,第三名为日本32台。 从近2年榜单来看系统装机量各国的变化,如图2,中国的系统装机量2年内有减少趋势,最高时为55届的226台美国的装机数量本届榜单相比上一届增加了27台。美国装机总性能保持第一,且新上榜系统数量最多(32台);日本装机系统的平均性能因为fugaku继续保持第一位。
中国系统制造商的装机总量领先,联想居首位500台系统中有273台系统采用中国系统制造商的产品,包括了联想lenovo(180台)、浪潮inspur(50台)、曙光sugon(36台)、华为huawei(7台),其中联想装机总量排名众多厂商第一,美国的hpe居第二位,装机数量为84台。与上一届相比,中国的总装机数量有所下降(21台)。
英特尔(intel)继续保持top500处理器最大供应商地位。英特尔继续保持着top500处理器最大提供商,份额占比从之前的86.40%下降到81.6%;amd处理器的占比则从9.6%上升至14.6%。在新上榜的70台系统中,配备intel处理器的系统42台,高于配备amd处top500系统保有量变化理器的数量(28台),但从总体来看,安装intel处理器的系统数量已有半年前的459台,下滑至现今的408台。使用arm架构处理器的系统与上届相同(5台)。
加速卡提升总体性能,nvidia成主要加速部件提供商。本届榜单中151台系统使用加速部件/协处理器技术,占总份额的30.2%,比6个月前的147台略有增加。其中,84台系统使用nvidia volta芯片,43台使用nvidia ampere, 8台使用nvidia pasca, 共计135台。新上榜的70台系统中,25台系统采用nvidia 加速卡技术,最高排名为第10位的microsoft azure系统在top100中,34台系统采用了加速部件而在top10中,80%采用了加速卡来提升总体性能。 高速以太网为主流互联技术,infiniband互联系统总性能最高。在超级计算机系统中,高速以太网是目前采用最多的互联技术,500台系统中有242台系统采用此种方式互联,占比为48.4%;而infiniband互联则助力更大规模超级计算系统,178台系统提供了总体性能的44.5%,且在前100名系统中,61台系统采用infiniband互联。
超算正向着基于大数据、人工智能(ai)的“ 数据密集型科学”演进。近年,超算应用不再仅限于建模和计算仿真等传统的科学和工程计算业务,涌现出新的数据密集型应用,如人工智能、机器学习、大数据分析等,要求更多的hpc资源来满足日益增长的工作负载和新型用户。随着要处理的数据量的暴增,高性能计算正从以计算为核心向以数据为核心的计算演进,数据密集型超算成为未来发展的主流方向之一。近几年的戈登贝尔奖的应用趋势也彰显出,人工智能+大数据+超算的融合正成为主流趋势。 2021年hpc china学术年会公布了最新的国内top100榜单中,新增“算力服务“(以算力为资源向用户提供计算服务)领域,占据系统份额为46%,其次是超算中心占24%、人工智能应用占9%。此外,100台系统中有一批实现商业化转型的超算系统上榜,以超级云计算服务的模式向用户提供算力。
文章小结
本届榜单e级计算系统仍未出现,日本的fugaku 富岳从55届上榜以来继续保持第一位。处理器和加速部件/协处理器方面仍是intel和nvidia占据主要份额;约半数系统采用高速以太网互联,但infiniband 仍为性能高的系统采用的主要互联技术;中国保持着装机量领先的地位,中国的联想成为超级计算系统的最大供应商,美国的装机总性能保持第一,日本的平均性能为最高。新兴技术(大数据、人工智能)与传统高性能计算的融合,推动着该行业的多元化发展,从科学型(计算为主)的应用向计算+数据型应用的演进。
5G将彻底消灭智能手机,未来没有智能手机的日子会是怎样?
Quartus II 15.0-温婉简约编译器
明日敲定 西部数据主导财团或夺标东芝芯片业务
场效应管起什么作用 场效应管类型怎么判断
nrf24l01接收延迟什么原因
全球超级计算机TOP10榜单情况介绍及分析
华为云业务取得的成果介绍
LED装饰照明控制系统的设计
降压升压型控制器LT8390A和LT8391A可在紧凑空间调节高功率电压和电流
RFID工业读卡器AGV自动化运输解决方案的详细介绍
智慧农业开始成为流行趋势了吗
荣耀9X背面图公布 电感X纹理渐变设计非常吸睛
机场做好这道题,才能万户千家共婵娟
剑指手势控制技术 英特尔有意收购手势识别公司
[组图]用晶体管驱动的电子管放大器
MES数据采集网关通过OPC UA网关实现工业现场设备对接OPC UA服务器
可快速替换催化燃烧原理的红外气体传感器
比较器/DAC组合解决数据采集问题
三相桥式全控整流电路
第二届张江国际人工智能挑战赛启动