浪潮AI服务器,屠榜刷新全球18项性能测试记录

美国东部时间10月21日,全球倍受瞩目的权威ai基准测试mlperf公布今年的推理测试榜单,浪潮ai服务器nf5488a5一举创造18项性能记录,在数据中心ai推理性能上遥遥领先其他厂商产品。
mlperf是当前全球最具影响力的ai计算基准评测组织,由图灵奖得主大卫·帕特森(david patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球ai训练和ai推理性能测试并发榜。此次mlperf的ai推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行ai计算产品的性能比试。今年mlperf训练榜单已于7月公布。
浪潮nf5488a5获数据中心ai性能绝对优势
此次浪潮nf5488a5一举创造18项mlperf推理性能记录,成为创纪录最多的ai服务器。今年的测试中,数据中心ai性能最受关注,全部参与机构提交了507项性能测试数据。浪潮nf5488a5创下了数据中心22个赛项中的13项性能记录以绝对优势领先,nvidia dgx取得了5项数据中心性能记录。而在此前的mlperf训练榜单中,nf5488a5在最核心的resnet50训练任务中也创下了性能记录,单机性能高居榜首。
△浪潮nf5488a5创造18项mlperf推理性能新记录
性能大幅提升3倍,全栈ai能力优势凸显
在此次基准测试中,浪潮ai服务器nf5488a5在开放优化(open)和固定任务(closed)的resnet50基准性能测试中,均表现优异,相比2019年mlperf推理榜单的服务器最好性能提升高达3倍。
△ 2019、2020年 resnet50推理性能对比
nf5488a5是浪潮自研的新一代ai服务器,是此次mlperf全球竞赛中唯一可以在4u空间内支持8块安培架构a100芯片实现nvlink高速互联的ai服务器。浪潮nf5488a5在系统拓扑上采用了超低延迟设计,支持pcie 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到ai芯片间的通信性能。同时,通过配置numa节点,确保每颗处理器与其直连的gpu之间通信性能最优,最大限度降低通信延迟。此外,nf5488a5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。
本次基准测试中,浪潮展示出了卓越的ai计算软硬件协同优化能力。在硬件层面,通过对cpu、gpu硬件性能的精细校准和全面优化,使cpu性能、gpu性能、cpu与gpu之间的数据通路均处于对ai推理最优状态;在软件层面,结合gpu硬件拓扑对多gpu的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合gpu tensor core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。
△ 各服务器mlperf ai推理性能对比(以浪潮nf5488a5为基准,越高越好)
浪潮是全球领先的ai计算领导厂商,其ai服务器在中国的市场份额已连续三年保持在50%以上。浪潮致力于ai计算平台、资源平台和算法平台的研发创新,并通过元脑生态与ai领先企业共同推进ai产业化和产业ai化进程。
责编ajx

小米「造」过车了,又轮到华为了
能量监测在直流系统中的作用
一文知道什么是漏极开路
智能语音电话机器人是什么,它的作用有哪些
重磅!荣耀V40新机发布 联手京东小魔方推“保值换新”套餐
浪潮AI服务器,屠榜刷新全球18项性能测试记录
10.1.8 相变存储器(PCRAM)∈《集成电路产业全书》
医疗器械赛道巨头攒动 腾讯云正面迎战百度、华为
USB4使用的几个要点
2025年中国将有6亿的5G连接并成为全球规模最大的5G市场
反馈系统自激振荡
富满20-60W USB PD协议芯片
EC20系列PLC 现代工业更高效
远传型磁翻板液位计由什么组成
vivo正式推出OriginOS 3系统
步进电机和伺服电机的辨别方法
同相放大器原理是什么
克服电化学气体传感的技术挑战
【笔记】Windows socket error的十大问题
关于同轴电缆与双绞线与光缆的优缺点分析