在拉斯维加斯举行的2019年国际消费电子展上,英特尔数据中心集团执行副总裁navin shenoy宣布英特尔nervana神经网络推理处理器将于今年投入生产。早在2016年,英特尔就以4.08亿美元的价格从圣地亚哥收购了拥有48人的ai saas初创公司nervana。 nervana当时是一家软件公司,提供一个名为nervana cloud的全栈软件即服务平台,在一个名为neon的开源框架基础上支持定制深度学习应用程序的开发。
据报道,nervana当时正致力于开发用于神经网络处理的定制芯片,他们声称使用这种芯片ai加速器的性能至少会领先gpu10倍。当然,开发自定义处理器对于小型软件团队来说是一项艰巨的任务,但是在它被英特尔收购后,要实现这一想法就变得现实多了。现在,英特尔宣布推出第一款产品,用于推理的英特尔nervana神经网络处理器,简称nnp-i。该公司还宣布将在今年下半年推出代号为“spring crest”的神经网络训练处理器。nervana engine最初是采用28nm技术开发的,计划在发布之前升级到14nm。英特尔目前还没有做出回应,但我们推断今年交付的设备将采用英特尔的14nm finfet技术,未来或许会改用10nm。
英特尔表示nervana正在与facebook合作开发,这是一个很有意思的消息,因为facebook是“超七”数据中心公司,其加速策略一直是不公开的。谷歌开发了自己的处理器,微软,亚马逊和aws等公司也在基于fpga的加速方面投入了大量资金。和facebook成为开发合作伙伴,应该能让nervana在今年下半年全面上市时获得可靠的端到端认证。
神经网络训练和推理是计算密集型的,涉及矩阵的张量乘法和卷积。多年来,图形处理单元(gpu)一直是人工智能训练加速的首选解决方案,而fpga一直在努力开拓推理游戏中的竞争优势。就像现成的芯片一样,gpu可以充分利用其高度并行的矢量和线性代数功能,非常适合人工智能任务。但是,由于gpu并非专为人工智能而设计,所以当涉及到人工智能和深度学习的架构优化时,gpu仍然有很多问题需要解决。
类似地,fpga可以通过更低的功耗为推理任务提供极高的并行性和性能,因为不同于训练,推理任务可以通过降低精度的定点计算来完成。大型数据中心和公有云已经开始利用fpga集群来加速推理任务,在吞吐量、延迟和计算效率方面取得了显着成果。然而,与gpu类似,典型的fpga上有许多不涉及ai计算的硬件,许多可编程架构使得fpga作为通用设备非常棒,但作为ai处理器却不够理想。
nervana是从gpu内核的深度学习开发人员的角度来解决这个问题的,这让他们深刻地认识到gpu对于ai任务的局限性。该公司表示,nervana引擎是从头开始设计的,抛弃了gpu架构,重新开始。他们分析了许多深层神经网络,并提出了他们认为的最适合关键操作的架构。他们还提出了一种新的数字格式——flexpoint,它试图最大化16位存储的精度。
由于人工智能计算可能非常耗费内存,因此nervana需要能够快速移动大量数据。nervana设备包括32gb的内置高带宽内存(hbm),可提供8tb/s的内存访问带宽。hbm存储器通过芯片3d堆叠实现高容量。一个hbm芯片栈可以存储8gb的数据,其中包含8个1gb的独立内存模块。nervana引擎包括4个hbm栈,提供32gb的存储。英特尔的多模封装技术将hbm与处理器核心阵列连接起来。我们推测这是由英特尔的2.5d嵌入式多模互连桥(emib)技术而不是新宣布的foveros 3d封装完成的,不过英特尔并没有给出明确答案。
nervana引擎由一系列“tensor processing cores”组成,这些核心由hbm基板、内存接口和高速io组成,旨在将许多nervana设备组合在一起,以提供超大规模的网络部署。英特尔尚未给出新设备的具体性能或功耗数据,只是说功耗将达到数百瓦,和movidius和mobileye等边缘目标ai设备相比,nervana明显将用于数据中心。
该设备包括六条双向高带宽链路,该公司表示该芯片能够在机箱内部或机箱之间无缝连接。该公司表示,这使用户能够通过简单地分配更多的计算,或者在不降低速度的情况扩展模型规模,从而在当前模型上获得线性加速。将多台设备连接在一起可以作为一个大处理器。
nervana的目标是在数据中心抢食gpu和fpga的市场。由于英特尔在其psg部门(前身为altera)拥有世界上最好的fpga技术之一,因此它认为nervana在推理方面超过fpga,在训练方面比gpu具有更明显的优势。特别是英伟达(nvidia),它在ai训练领域占据着主导地位,显然是nervana瞄准的目标。
随着更多不同领域的ai设备进入市场,目前的通用处理器芯片无法满足需求,会有越来越多的ai芯片出现,我们将拭目以待。
燧原科技当选上海市人工智能标准化技术委员会委员
iPhone8新消息:屏幕内指纹识别,或支持AR
LG V60 ThinQ 5G音频测试成绩出炉,多项测试项目成绩表现不佳
苹果开发燃料电池技术为哪般?
机车运行信息检测系统的设计和实现
英特尔新推AI芯片Nervana
实际电感与电容元件
鸿蒙开发第一课-各类名词介绍以及基础功能实现
23全球AMOLED手机面板出货量下滑 中国厂商出货份额首次超越40%
全新 PSA Certified 固件更新 API:为物联网设备安全保驾护航
微软中的FPGA发展历程盘点
如何正确使用网管工业交换机
物通博联5G-kafka工业智能网关轻松实现数据采集kafka上云
工业互联网平台建设如何体现自己的价值
iphone8什么时候上市?iphone8最新消息:iPhone8将配大电池版本!中国首发后可能又要涨价!
夯实可持续经营能力 菲菱科思为公司稳健发展保驾护航
呼叫中心智能办公,就用华为云桌面
输出多种直流电压的AC/DC电源模块设计方案
小米6新品发布会直播进行时,雷军会带来哪些黑科技呢?
安富利能发挥作用帮助城市更好地部署物联网技术