(文章来源:浪潮企业级解决方案)
浪潮联合赛灵思宣布推出全球首款集成hbm2高速缓存的fpga ai加速卡f37x,可在不到75w典型应用功耗提供28.1tops的int8计算性能和460gb/s的超高数据带宽,适合于机器学习推理、视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、nfv、大数据分析查询等各类应用场景,实现高性能、高带宽、低延迟、低功耗的ai计算加速。
f37x是浪潮专为ai极致性能设计的尖端fpga加速卡,它采用xilinx virtex ultrascale+架构,提供285万个系统逻辑单元和9024个dsp单元,int8计算性能达到了28.1tops,集成8gb hbm2高速缓存,带宽达460gb/s,相比单ddr4 dimm提升20倍。当ai计算模型尺寸小于hbm2容量时,可全部预先载入高速缓存之中,消除了外部读写带来的数据传输延迟并提高处理速度,使ai计算完全放到片上成为可能。
性能数据显示,浪潮f37x在ai图像识别实时推理场景,基于googlenet深度学习网络模型,当batchsize=1时性能高达8600 images/s,是cpu性能的40倍。f37x典型应用功耗仅为75瓦,性能功耗比高达375gops/w。此外,f37x板载24gb ddr4内存及双端口100gbps高速网络接口。f37x设计为全高半长pci-e 3.0板卡,紧致的尺寸可使得单台ai服务器支持更多加速卡设备,从而提供极限计算与通信性能。
f37x可支持c/c++、opencl和rtl三种主流的编程语言开发环境。相应sdx工具套件内含sdaccel、vivado及sdk工具,应用已有的opencv、blas、encoder、dnn、cnn等加速库,实现对主流深度学习框架如caffe、tensorflow、torch、theano等的支持,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型ai应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的ai定制算法应用,在软件生产力上实现了质的飞跃。
浪潮集团副总裁李金表示:ai正以前所未有的速度重构产业创新,ai算法将不断快速迭代,线上推理将成为ai计算的主要场景。浪潮一直致力创新fpga软硬件技术,帮助客户持续获得领先的ai计算竞争力。浪潮f37x加速卡将为全球用户提供快速可定制、实时高性能、高密低功耗的先进的fpga解决方案,加速ai应用的线上部署。
赛灵思公司数据中心销售副总裁freddy engineer表示:浪潮因产品执行和创新而享誉全球。浪潮将为客户提供搭载xilinx加速卡的服务器,我们为此而自豪。我们非常高兴能成为浪潮的开发合作伙伴,联合推出突破性产品f37x,它通过hbm2提供前所未有的内存带宽,将加速数据分析、ai和需要最低延迟数据访问的工作负载。
浪潮是全球领先的ai计算力厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的ai基础设施。浪潮帮助ai客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。
荣耀V40系列三款型号公布
即将发布!iQOO Neo 5部分配置信息曝光
5G已经给中国社会带来了重大变化
光纤传感器的原理_光纤传感器的特征
全球首个 中国广电700MHz大带宽成为5G国际标准
浪潮联合Xilinx推出业界首款集成HBM2的FPGA
在鸿蒙系统的撸引导页代码的经验
眼球追踪技术大揭秘
华为,3G元年之初体验
双向ESD静电保护器件二极管 DW03D-B-S 原厂直供
OpenAI“宫斗”续:96%员工辞职威胁,微软或成最大赢家?
尖晶石结构正极材料动力锂电池的热安全性研究
5G下通信测试仪器有什么发展的希望
如何使用proteus仿真软件进行ARM7显示系统
魅族 Note9详细评测:它会是今年千元机的新标杆吗?
国网信息通信产业集团有限公司与腾讯云在北京签署合作协议
存储技术新突破,10PB单盘使用寿命超过5000年
如何快速且经济高效地为空间受限和密封的设备添加无线充电
DesignStart Cortex-M3软件开发网上课程
300mW 调频发射机,FM transmitter