连英特尔都不得不使用,ARM GPU到底有何魔力?

随着智能手机平板电脑进入视网膜屏高清时代,gpu的重要性日益凸显,用户在使用这些电子设备时,首先关注的是高清视频、3d游戏以及flash动画的体验,而这些体验和gpu性能有直接联系,一款性能出色的gpu不但可以给用户以最佳体验,更兼顾低功耗特性,在cpu核战已无悬念的情况下,未来gpu将如何发展?近日,笔者采访了arm公司媒体处理部门战略营销副总裁kevin smith,就arm gpu未来发展进行了交流,归纳为arm gpu的三个发展趋势。
kevin smith
趋势一:关注可扩展性,gpu核战爆发在即
在pc领域,曾经爆发过有关cpu与gpu谁更重要的口水大战,现在看来,两者都重要,因为它们架构不同、侧重不同,cpu和gpu都是具有高速运算能力的芯片,cpu更像“通才”——指令运算+数值运算,gpu更像“专才”——图形计算,不同类型的运算速度决定了它们的能力。因此cpu更擅长像操作系统、系统软件和通用应用程序这类拥有复杂指令调度、循环、分支、逻辑判断的程序任务,而gpu则擅长图形类和非图形类的高度并行数值计算。因此,在一部手机或者平板中,两者需要均衡搭配才能发挥出最大效能。
到目前为止,arm共发布了人mali100、mali300、mali400、mali450和mali t600等五个系列的gpu,在malit600以后,arm gpu在结构上发上了很大改变,以桌面应用看齐,在性能上有很大提升。
mali400结构功能图
mali-t604功能图
kevin smith介绍说实际上在发布t600系列时,arm已经考虑到了与未来64位处理器的兼容问题,所以mali-t600的第二代支持64位双精度,可以与arm最新的a50系列64位处理器紧密关联。“另外,t600系列采用了这色器内核架构和三管道体系,更容易实现多核,这比其他架构gpu更有优势。” kevin smith强调。“未来arm会重点优化t600系列产品,例如我们最新发布的t624t628t678就比t604在同等裸片面积性能提升 50%!”
他解释说性能的提升源自对架构的增强,例如这三款系列gpu可在同样的内核面积下提供更高的时钟频率、更高的ipc(每时钟周期指令数)、更高的能效,所以每个型号的性能都可以提升50%。
另外,这三款gpu也首次次支持astc(适应性可扩展纹理压缩):这是一种由arm开发、khronos group已将其纳入opengl es规范的纹理压缩技术,能在系统级别提高效率,并改进纹理质量和弹性,“而且,arm gpu也是率先支持opengl es 3.0版新标准的处理器。”他指出,“我们的gpu支持opengl full profile的gpu计算,不但支持opengl es 1.1/2.0/3.0、dx 11/11 fl 9_3,此外还支持google renderscript计算语言。实际上已经向桌面应用看齐。也向gpgpu更迈进了一步。当然,这也是增强兼容性的举措,我们的策略是就是支持公开的各类标准和api。”
mali-t678功能框图
由于gpu的并行架构更适合实现多核,因此为未来多核gpu将是一大亮点,kevin表示依托arm的独特优势,未来不管是16核还是24核均可以轻易实现。
arm gpu的,扩展性示意图
在我采访imagination时,他们也勾勒了一幅未来处理器发展的蓝图,显然,多核gpu是亮点。
未来处理器发展的蓝图
那么2013年,主流的gpu产品将是多是核心?kevin认为8核gpu会出现但将是高端市场,主流市场仍将是四核为主,不过他认为明年市场上gpu跨度较大,从单核到双核到四核到8核都有出现,满足市场从低到高的需求。
近日,谷歌nexus 10平板电脑已经面市,该机采用一块10英寸屏幕,分辨率高达2560×1600像素,像素密度为300ppi,超过了ipad4和新 ipad,它采用了1.7ghz主频的三星exynos 5250双核处理器,配备2gb ram,集成mali t604四核gpu,kevin强调这样高端机型足以说明arm gpu可以支持高端应用。
在gpu的发展策略上,kevin介绍说arm会坚持以较小的面积实现更高的性能,即坚持高能效的策略,同时,会考虑高性能方向,向桌面gpu看齐。
以下是各类gpu的功耗对比,可以看出,arm gpu在单位功耗方面的性能突出,能达到每瓦48gflops的特性,原高于桌面gpu的能效。
趋势二:关注一致性,与cpu融合
在pc处理器领域,amd以融合cpu和gpu的apu开创了新的pc处理器领域,在移动处理器领域,这个趋势仍将延续,从近日 imagination对mips的收购已经显现端倪。kevin也认同这个趋势,“arm的gpu不但注重图形处理更看重通用计算,未来cpu与gpu 要走融合的道路,所以arm在布局gpu时就考虑与未来cpu的搭配,比如我们的gpu是支持64位处理器的,所以未来处理器升级到64位我们都可以支持。”他指出,“arm考虑到是让用户用最快的方式实现低功耗高性能处理器,未来融合cpu与gpu的soc内部会采用arm的amba总线。”
实际上,在arm的的mali-t600 系列 gpu 内的有个作业管理器,它可以任务管理从 cpu 卸载到 gpu,并在活动着色器内核之间实现无缝负载平衡。这个功能估计已经为未来的cpu与gpu融合埋下了伏笔,通过 arm 的一致性和互连技术,计算任务在异类系统中进行共享处理时,可以轻松跨越 cpu、gpu 和其他可用计算资源,更高效地访问数据。
他强调arm gpu还关注通用计算,因此,未来也将压缩dsp市场,ceva是否感受到了压力?
从支持64位处理里来看,未来采用融合cpu与gpu的处理器将是a50系列处理器,按照某些芯片厂商的估计,预计2014年此类芯片可以面市。
趋势三:工艺升级,2014年arm处理器采用finfet技术?
很多人认为arm处理器在传统工艺上的升级空间已经不大,在英特尔大张旗鼓地宣传3d晶体管技术的时候,arm 其实也也已经开始了下一代工艺技术的研发,kevin透露arm的pip(物理ip)部门早与tsmc以及global foundries合作开始了下一代工艺finfet晶体管工艺技术的研发,这是前所未有的,预计新的工艺技术将在tsmc的16nm工艺 和global foundries上的14nm上实现,而新工艺可能会用于arm下一代64位处理器上。
在具体产品发展上,在arm公布了最新的a50系列处理器后,已经有amd、博通(broadcom)、calxeda、海思半导体、三星及意法半导体等七家公司获得a53与a57处理器授权,其中,ste声称将在2014年出货a53处理器,这是否意味着2014年arm处理器将采用finfet 工艺技术?
在今年1月召开的2012国际电子器件会议(iedm)上,tsmc已经展示有关finfet晶体管工艺技术,台积电将提供的16nm工艺金属布线部分直接沿袭20nm工艺,将晶体管部分换成16nm工艺的finfet。与20nm工艺相比,可使晶体管的工作速度提高20%~25%,使耗电量降低 35%。由于金属布线部分在20nm工艺和16nm工艺间通用,因此两工艺的芯片面积相同。与intel的工艺不同,台积电的finfet晶体管掺入了锗材料。
tsmc展示有关finfet晶体管工艺技术
以下为采用主要gpu的处理器性能对比

MAX2371中频AGC放大器,频率为220MHz
车用、医疗半导体需求强劲 MCU/模拟芯片大利多
基于TS-900的PXI半导体测试系统解决方案
闪烁灯电路分析:LED即使在不闪的情况下也会微亮
研究人员设计出一种“可穿戴空调” 有望引领新兴的皮肤电子产品
连英特尔都不得不使用,ARM GPU到底有何魔力?
索尼年底推出鹦鹉螺式可卷曲手机!
改善动态环路响应
三星推出试播季计划 专门帮助独立制片公司制作VR内容
手机上的NFC功能到底有什么作用
2019年全球穿戴式装置出货量达2.25亿台, 相关PCB供应链有望从中受惠
低电压高效率的微波功率放大器
ROHM确立了业界超小短波红外(SWIR)器件的量产技术
Wear OS 4即将问世 电池寿命更长
TK5110线缆对线器的作用是什么
Bowler Pons部署Cepton的智能激光雷达解决方案
没有社交 VR不可能成功
【解决方案】安科瑞电力监控系统在江苏恒艾营养品20KV变电所工程的设计与应用
电信系统构成有哪些?
如何将非Matter设备桥接到Matter网络