威盛开发出世界上第一个集成AI协处理器的x86处理器 支持AVX-512指令集

除了intel、amd,宝岛***的威盛也会造x86处理器的,不知道还有多少人知道?最近,威盛旗下已有24年历史的处理器研发部门centaur开发出了世界上第一个集成ai协处理器的x86处理器,并有了可工作的原型,今年9月份开始芯片测试。
新处理器采用台积电16nm工艺制造,内核面积不超过195平方毫米,内部采用环形总线设计,串联集成八个x86 cpu核心、16mb共享三级缓存、四通道ddr4-3200内存控制器、pcie 3.0控制器(44条)、南桥和io功能,是一颗完整的soc。
最大亮点是ai协处理器“ncore”,占用面积约34.4平方毫米(17.6%),软件映射为pci设备,支持dnn深度神经网络创建与训练的加速,号称可提供多达20tb/s的内存带宽、每秒20万亿次ai操作的性能。
主频可以工作在2.5ghz,而且竟然支持avx-512指令集,这可是amd zen 2架构都没有的。
cha处理器内核图
cha处理器模块简图
近日,centaur公布了这颗处理器的诸多架构细节,但有趣的是并非自行公布,而是来自美国加州处理器技术权威机构、 著名芯片杂志《microprocessor report》发行商linley group,后者仔细研究了centaur的处理器架构设计文档,并采访了相关设计师,给出了这份报告。
《microprocessor report》杂志主编linley gwennap对这颗全新设计的x86处理器不吝溢美之词:“centaur高调重返x86市场,带来了革新的处理器设计,整个八个高性能cpu核心、一个定制深度学习加速器(dla)。这是业界第一个集成dla的服务器处理器设计。新的加速器ncore的神经网络性能甚至比最强大的至强还要好,而且不需要昂贵的外部gpu计算卡辅助。”
linley group透露,centaur的全新x86微架构叫做“cns”,设计目标是ipc要高于传统pc处理器,每时钟周期可解码4条x86指令,并行执行10个微操,首颗处理器暂命名“cha”,其中ai协处理器int8整数的峰值性能高达20tops(20万亿次操作每秒)。
cns微架构图
ncore ai协处理器架构图
linley group基于权威的mlperf性能测试来衡量x86处理器的ai性能,结果发现centaur cha处理器的ai推理性能,相当于23个世界级的intel x86核心,而且后者必须是支持512位的vnni矢量神经网络指令才行。——事实上,intel现在还没有真正的32核心产品。
centaur ai协处理器的架构设计类似vnni指令的simd(单指令多数据)理念,但是在16mb专用内存、20tb/s带宽的支持下,每个时钟周期可以处理32768个数据位,而且将推理处理交给专门的ai协处理器后,x86核心就可以放心执行其他通用任务。
centaur还为开发者提供了新的算法,可充分利用centaru ai协处理器无与伦比的超低推理延迟,并与x86 cpu核心密切配合。
在纽约州举办的isc east大会上,centaur还首次公开展示了cha处理器,而且除了视频分析、实时物体检测和分类等传统ai应用之外,还唯一秀了一把语义分割(像素级图像分类)、人体姿态估计(简笔画)等前沿应用,让人大开眼界。
目前,centaur正在改进优化新平台的硬件性能、软件效率,而新处理器预计明年下半年正式投产。
linley group的详细报告可以点击这里下载
不同cpu架构的对比


华为启动买买买模式?1.5亿收购以色列IT网络公司Toga
太阳诱电MLCC陶瓷贴电容问答小课堂
微传感器在以后是怎样的趋势
华为已经参与了英国现有非核心移动网络建设
移动装置市场竞争激烈 业者为抢食平板大饼
威盛开发出世界上第一个集成AI协处理器的x86处理器 支持AVX-512指令集
可穿戴感应器市场可期 未来规模增速惊人
央视高精度LED屏“身世”成迷?
华为麦芒7体验评测 性能强劲游戏流畅
区块链技术正被用于转变供应链管理和许多其他行业
手机QQ陌陌聊天记录删除了怎么恢复
5G无缘霸屏2018年CES 5G到底有多大影响 或将成为2019年CES主流
15家LED上市公司2016年业绩汇总 你看好哪家?
直流电路中的功率传递
集成电路高景气的热潮持续 黄金时代即将到来
#Ingenic Inside#盘点华米运动手表征服用户的8项技能
数字货币与我们现实世界中法币的本质区别是什么
新思科技DSO.ai助力客户完成100次流片,引领AI在芯片设计中的规模化应用
AR互动技术遇到大屏可以应用在哪些场景
富士康与FCA联手 电动车和车联网是发展的两大重点