(文章来源:cnbeta)
随着人工智能和机器学习应用的兴起,研究者对于深度学习和训练的计算量需求也日渐提升。为满足这种密集的运算需求,通常需要相当大规模的服务器集群。在今年早些时候的 hot chips 大会上,我们已经见到过来自英特尔的 nervana nnp-t spring crest 芯片。通过收购 nervana,英特尔获得了打造“大型训练芯片”所需的 ip 。
据悉,该芯片基于台积电 16nm 工艺制造,辅以 cowos 和四层 hbm2 内存,面积达到了 680 平方毫米。本周早些时候,supermicro 已经在超算大会上展示了最新的 nervana nnp-t 服务器。
这些硬件均基于 pcie 扩展卡,可想象它们此前被设计为可容纳 gpu 的传统服务器。其采用了典型 2p 布局,可在 4u 机箱中插入 8 张扩展卡,且计算卡之间可以互相通信。每颗芯片具有 3.58 tbps 的总双向带宽,而片外连接则支持多达 1024 个节点的可伸缩性。从每张 pcie 卡片的 8-pin 辅助供电来看,其峰值功率应该在标准的 225w 。
本周晚些时候,supermicro 告知其已获准展示该系列服务器的 8 路 oam(ocp 加速器模块)版本。其能够通过底板的 pcb 保持芯片间的通信,而不是传统的 pcie 卡对卡之类的桥接器。
这使得扩展卡之间能够流通大量的空气来散热,并且兼容模块化的 ocp 标准。作为英特尔首款支持 bfloat16 深度学习训练的芯片,每个芯片最多支持 119 个 top 。另有 60mb 片上存储器和 24 个专用的“张量”处理器集群,后者具有双 32×32 矩阵乘法阵列。该芯片共有 270 亿个晶体管,内核频率 1.1 ghz、辅以 32gb hbm2-2400 内存。
从技术上来讲,pcie 连接可以升级到 gen 4.0 x16,但英特尔商务 cpu 支持这项特性。有人表示,为展开此类计算,一些客户正在将头结点从 2p 升级到 4p(facebook 更是用上了 8p)。supermicro 声明称,其 nnp-t 系统已做好助推深度学习和训练的部署准备。
管式土壤墒情监测站的作用是什么,它有哪些功能
一张超详细图,掌握1kHz到300GHz全球频率分配
阿尔法向西班牙武装部队提供无人驾驶直升机
关于典型和非典型无线通信应用射频前端之解决方案的分析和介绍
基于Linux的Socket网络编程的性能优化
Supermicro推出新款英特尔Nervana NNP-T服务器
贾跃亭否认工厂缩水 称FF91会按时交付
MPlayer快捷键
疑似回击马斯克抄袭,何小鹏:要在中国的自动驾驶打败你
三星力争取高通3nm订单,挑战台积电代工霸权?
儿童闹钟的制作
鼎阳科技发布8GHz带宽12-bit高分辨率示波器,树立国产示波器新标杆
美国贸易将拼多多列入黑名单 淘宝也榜上有名
朝鲜推出的iPad平板电脑 苹果乔布斯看了可能会打人
电磁流量计日常维护的2种方法详细解析
高通面向5G商用的关键问题演讲
AP9195直流电源供电LED升压恒流驱动IC方案
IMU惯性测量单元的基本原理-惯导专题
MEMS传感器如何让交通更安全和更高效
给孩子学习用的台灯到底该怎么挑?护眼灯到底护不护眼?