英特尔新推AI芯片Nervana

在拉斯维加斯举行的2019年国际消费电子展上，英特尔数据中心集团执行副总裁navin shenoy宣布英特尔nervana神经网络推理处理器将于今年投入生产。早在2016年，英特尔就以4.08亿美元的价格从圣地亚哥收购了拥有48人的ai saas初创公司nervana。 nervana当时是一家软件公司，提供一个名为nervana cloud的全栈软件即服务平台，在一个名为neon的开源框架基础上支持定制深度学习应用程序的开发。
据报道，nervana当时正致力于开发用于神经网络处理的定制芯片，他们声称使用这种芯片ai加速器的性能至少会领先gpu10倍。当然，开发自定义处理器对于小型软件团队来说是一项艰巨的任务，但是在它被英特尔收购后，要实现这一想法就变得现实多了。现在，英特尔宣布推出第一款产品，用于推理的英特尔nervana神经网络处理器，简称nnp-i。该公司还宣布将在今年下半年推出代号为“spring crest”的神经网络训练处理器。nervana engine最初是采用28nm技术开发的，计划在发布之前升级到14nm。英特尔目前还没有做出回应，但我们推断今年交付的设备将采用英特尔的14nm finfet技术，未来或许会改用10nm。
英特尔表示nervana正在与facebook合作开发，这是一个很有意思的消息，因为facebook是“超七”数据中心公司，其加速策略一直是不公开的。谷歌开发了自己的处理器，微软，亚马逊和aws等公司也在基于fpga的加速方面投入了大量资金。和facebook成为开发合作伙伴，应该能让nervana在今年下半年全面上市时获得可靠的端到端认证。
神经网络训练和推理是计算密集型的，涉及矩阵的张量乘法和卷积。多年来，图形处理单元（gpu）一直是人工智能训练加速的首选解决方案，而fpga一直在努力开拓推理游戏中的竞争优势。就像现成的芯片一样，gpu可以充分利用其高度并行的矢量和线性代数功能，非常适合人工智能任务。但是，由于gpu并非专为人工智能而设计，所以当涉及到人工智能和深度学习的架构优化时，gpu仍然有很多问题需要解决。
类似地，fpga可以通过更低的功耗为推理任务提供极高的并行性和性能，因为不同于训练，推理任务可以通过降低精度的定点计算来完成。大型数据中心和公有云已经开始利用fpga集群来加速推理任务，在吞吐量、延迟和计算效率方面取得了显着成果。然而，与gpu类似，典型的fpga上有许多不涉及ai计算的硬件，许多可编程架构使得fpga作为通用设备非常棒，但作为ai处理器却不够理想。
nervana是从gpu内核的深度学习开发人员的角度来解决这个问题的，这让他们深刻地认识到gpu对于ai任务的局限性。该公司表示，nervana引擎是从头开始设计的，抛弃了gpu架构，重新开始。他们分析了许多深层神经网络，并提出了他们认为的最适合关键操作的架构。他们还提出了一种新的数字格式——flexpoint，它试图最大化16位存储的精度。
由于人工智能计算可能非常耗费内存，因此nervana需要能够快速移动大量数据。nervana设备包括32gb的内置高带宽内存（hbm），可提供8tb/s的内存访问带宽。hbm存储器通过芯片3d堆叠实现高容量。一个hbm芯片栈可以存储8gb的数据，其中包含8个1gb的独立内存模块。nervana引擎包括4个hbm栈，提供32gb的存储。英特尔的多模封装技术将hbm与处理器核心阵列连接起来。我们推测这是由英特尔的2.5d嵌入式多模互连桥(emib)技术而不是新宣布的foveros 3d封装完成的，不过英特尔并没有给出明确答案。
nervana引擎由一系列“tensor processing cores”组成，这些核心由hbm基板、内存接口和高速io组成，旨在将许多nervana设备组合在一起，以提供超大规模的网络部署。英特尔尚未给出新设备的具体性能或功耗数据，只是说功耗将达到数百瓦，和movidius和mobileye等边缘目标ai设备相比，nervana明显将用于数据中心。
该设备包括六条双向高带宽链路，该公司表示该芯片能够在机箱内部或机箱之间无缝连接。该公司表示，这使用户能够通过简单地分配更多的计算，或者在不降低速度的情况扩展模型规模，从而在当前模型上获得线性加速。将多台设备连接在一起可以作为一个大处理器。
nervana的目标是在数据中心抢食gpu和fpga的市场。由于英特尔在其psg部门（前身为altera）拥有世界上最好的fpga技术之一，因此它认为nervana在推理方面超过fpga，在训练方面比gpu具有更明显的优势。特别是英伟达(nvidia)，它在ai训练领域占据着主导地位，显然是nervana瞄准的目标。
随着更多不同领域的ai设备进入市场，目前的通用处理器芯片无法满足需求，会有越来越多的ai芯片出现，我们将拭目以待。

燧原科技当选上海市人工智能标准化技术委员会委员
iPhone8新消息：屏幕内指纹识别，或支持AR
LG V60 ThinQ 5G音频测试成绩出炉，多项测试项目成绩表现不佳
苹果开发燃料电池技术为哪般？
机车运行信息检测系统的设计和实现
英特尔新推AI芯片Nervana
实际电感与电容元件
鸿蒙开发第一课-各类名词介绍以及基础功能实现
23全球AMOLED手机面板出货量下滑中国厂商出货份额首次超越40%
全新 PSA Certified 固件更新 API：为物联网设备安全保驾护航
微软中的FPGA发展历程盘点
如何正确使用网管工业交换机
物通博联5G-kafka工业智能网关轻松实现数据采集kafka上云
工业互联网平台建设如何体现自己的价值
iphone8什么时候上市？iphone8最新消息：iPhone8将配大电池版本！中国首发后可能又要涨价！
夯实可持续经营能力菲菱科思为公司稳健发展保驾护航
呼叫中心智能办公，就用华为云桌面
输出多种直流电压的AC/DC电源模块设计方案
小米6新品发布会直播进行时，雷军会带来哪些黑科技呢？
安富利能发挥作用帮助城市更好地部署物联网技术