人工智能处理器三强Intel/NVIDIA/AMD谁称霸?

英特尔在旧金山idf16上除了核心亮点融合现实(mr)alloy项目之外,新一代至强融核(xeon phi)处理器也一同发布。intel、nividia、amd作为pc时代的老对手,在人工智能时代,它们的竞争又会碰撞出怎么样的火花?
借着idf16的余温还未褪去,我们在文章中将首先谈一谈错失移动互联网红利的英特尔在人工智能方面做了哪些努力,接下来将会通过英特尔、英伟达、amd在2016年最新发布的xeon phi、nvidia tesla、amd firepro s处理器来探究究竟谁能够成为人工智能领域的霸主。
英特尔积极布局人工智能
数据显示,2015年全球人工智能市场规模到达1683.9亿元,预计2020年将达到近3700亿元,年复合增长率达到17%。谷歌、facebook、微软等科技巨头纷纷押注人工智能领域,pc芯片霸主英特尔在错过移动互联网的红利之后也开始了在人工智能领域的布局。
2015-2020年全球人工智能市场规模
2015年,intel以167亿美元收购了年收入不足20亿美元的全球第二大fpga厂商altera。由于fpga 是具有一定的可编程性,介于专用芯片和通用芯片之间,可同时进行数据并行和任务并行计算,在图像识别、信号处理等特定场景中具有比 gpu、cpu 更高的性价比。因此此举被认为是这是英特尔布局人工智能的一个重要战略。
idf16之前,英特尔宣布收购深度学习创业公司 nervana system,该公司是一家在芯片领域具有自主知识产权的公司,旗下的 engine 芯片在深度学习训练时有着比传统 gpu 的能耗和性能优势。
凭借着两大收购,英特尔基本补齐了在人工智能,尤其是机器学习领域的两大短板,同时也进一步延伸了处理器的业务体系。更重要的是,英特尔旗下的风险投资机构过去几年在人工智能领域也十分活跃。
英特尔xeon phi处理器
idf16上,intel发布第三代xeon phi处理器,代号knights mil。它将是2011年代号knigts corner,22nm工艺,最多61个核心,浮点性能1tflops,和2013年代号knights landing,14nm工艺,最多72核心,浮点性能3+tflops之后的继任者。
knights mill架构是第三代,目前只知道它会在2017年问世,制程工艺升级到10nm,同时会支持intel第二代omni-path网络架构,但是intel并没有公布太多细节,具体的性能等级也未知。不过knights mill除了继续提高能效、优化并行性能、增强各种运行精度、搭配高弹性大容量内存之外,dl深度学习也会是重点。
xeon phi是intel针对高性能计算市场推出的处理器,与主要竞争产品有nvidia的tesla、amd的firepro s相比,后两者是基于gpu的,xeon phi是x86众核架构的。
nvidia tesla
在深度学习芯片领域,nvidia的gpu 具备统治性的地位,在2016年国际超级计算大会上,nvidia发布了pci-e版本的tesla p100。
tesla p100是帕斯卡家族的首款产品,也是迄今唯一基于gp100大核心的产品,不过此前发布的版本是面向nvlink总线服务器的,而今天的新款则用于传统pci-e环境。二者核心规格完全相同,都有3584个流处理器,只不过核心加速频率从1480mhz降至1300mhz(基础频率未公布),因此计算性能损失了大约22%,半精度浮点18.7tflops(每秒18.7万亿次计算)、单精度浮点9.3tflops、双精度浮点4.7tflops。
显存继续搭载hbm2,频率也保持在1.4ghz,但除了4096-bit 16gb的完整版,还有个3072-bit 12gb的精简版,带宽分别为720gb/s、540gb/s。
由于频率降低,新卡的功耗也从300w降到了250w,和上一代tesla m10相同,可以无缝升级,继续配合服务器采用被动散热。
tesla p100和配套软件将在今年第四季度出货,具体价格未公布。
amd firepro
amd在今年早些时候发布了号称世界最强vr显卡radeon pro duo,双芯fiji,随后amd又推出了面向hpc、数据中心等高性能加速卡firepro s9300 x2,该处理器是双芯fiji专业版,浮点性能13.9tflops,8gb hbm显存,tdp为300w,号称世界单精度性能最高的专业卡,售价5999美元。
amd的firepro s系列主要面向hpc市场,与前面介绍的intel xeon phi及nvidia tesla k系列形成竞争关系。它们在hpc领域多是用作加速卡,所以浮点性能非常强大。
amd宣称s9300 x2是世界最快的单精度加速卡
firepro s9300这次使用的是2个fiji完整核心,每个gpu有4096个流处理器单元,跟之前发布的radeon pro duo差不多,不过因为被动散热,所以其频率肯定会降低一些,13.9tflops的浮点性能与后者的16tflops有所下降,但它在gpu加速卡中其性能依然是拔尖的,amd宣称s9300 x2是世界最快的单精度加速卡。
竞品的对比
nvidia同级别的对手是tesla k80,浮点性能只有5.6tflops,带宽480gb/s,显存容量24gb,tdp为300w,而firepro s9300 x2在同为300w tdp下浮点性能翻倍,带宽更是高达1tb/s,虽然8gb的显存容量不够看,不过别忘了它使用的是hbm显存,跟普通gddr5显存不一样。
firepro s系列解决方案
firepro s9300 x2专业卡售价为5999美元,折合人民币38682元左右,而nvidia的k80发布时售价为5000美元,后来降到4000美元。
谁能称霸?
通过上面的详细介绍,想必你对xeon phi、nvidia tesla、amd firepro s最新人工智能处理器都有了一定的认识。目前来看nvidia占据一定的优势,amd在追赶,借助收购补齐短板的英特尔未来可期。
随着三大厂商此产品的上市,在未来的人工智能、深度学习领域,谁能笑到最后还很难预测,我们只能拭目以待。

荣耀20青春版评测 超越预期的千元机
最新稳定版Edge浏览器已提供针对M1 Mac的优化
赞叹不已的背后给你透露一些A9处理器技术细节
一种数字信号处理系统设计方案
Adam Taylor玩转MicroZed:MicroZed操作系统
人工智能处理器三强Intel/NVIDIA/AMD谁称霸?
丰田将为租车公司Avis提供1万辆联网汽车
基于ARM946E处理器的MP3解码优化设计
三星发布Exynos 9810芯片 将应用到Galaxy S9手机
TWS辅听器与TWS耳机的发展关系
电网行业解决方案
物联网和大健康产业给农业带来的新方向是什么
GPF芯片的单片机编程开发技巧案例详细说明
冷焊机分几种
如何使用RISC-V创建自定义处理器
首款搭载Android Go的三星设备上架印度 售价600元
SEMI就华为禁令发声:请求将禁令宽限120天
为什么加密货币要在很久之后才有可能被广泛采用
谷歌、FB告诉你如何用AI提升公司效率
预计2023年全球二轮车用锂电池出货量接近26GWh