在绝大部分手机爱好者的印象中,当代手机gpu的性能与能效排名,理论上是苹果最强,高通紧随其后,而arm的mali gpu则显著落后于前两者。去年年中我们发布过一篇题为《arm新版mali gpu简析:这次终于赶超高通和苹果?》[1]的文章,简单谈了谈mali g77的理论性能。似乎在arm的规划中,mali g77是有机会超越高通adreno gpu的。
预计最早将采用mali g77 gpu的手机soc为联发科天玑1000或三星exynos 990;同代的高通骁龙865与adreno 650前不久也已经发布。这会儿虽然还没有采用adreno 650 gpu的机型面世,采用mali g77的中低端机型也才刚刚开售,但从2019年包括iphone 11系列(a13 soc)在内的诸多手机产品的问世、imagination a-series gpu新架构的发布,实则已经很容易发现当前手机市场的gpu表现,已非两年前的格局。
前不久的imagination发布会上[2],imagination提到,如果将高通adreno 640的性能和占地面积记作100%,arm mali g76则需要184%的占地面积,才能达到100%的性能。这大概是mali gpu被对比得最惨烈的一次,似乎这也符合我们对mali gpu性能、能效孱弱的历史认知。
不过我们认为这个说法可能仍然不够准确,毕竟这和具体的产品相关:高通骁龙855(adreno 640)采用的是台积电7nm制程,而与之对比的三星exynos 9820(mali g76)则采用三星自家的8nm制程,仅是制造工艺的对比就已经不公平了;事实上,不同soc制造商对于mali gpu的实施方案也不尽相同,华为海思对于mali g76的实施方案和三星就是不一样的。
本文我们借助在售机型的一些现成图形计算跑分测试,以及gpu ip厂商对于新产品的解读,来总结性地谈一谈当前手机gpu在性能、能效方面究竟是什么格局。
移动gpu市场的主要玩家
首先还是将需要对比的主要手机gpu产品(或ip)做个罗列。这里援引两家统计机构针对移动gpu市场分析所得的数据,虽然数据并不是最新的,但仍可基本反映当前移动gpu市场的现状。
从手机与平板出货量来看,2019年第二季度的不同移动gpu出货量的市场占比分别如下图所示:
数据来源:stategy analytics
这份数据来自strategy analytics[3],由于我们没有完整的数据,所以这张图仅根据strategy analytics当时发布的新闻稿绘制。值得一提的是,其中的“others”其他,主要是imagination和intel,这里仅知imagination的市场份额仍高于intel,但不清楚这两者分别的占比具体是多少。这份数据也符合我们对于移动gpu市场的认识,即该市场的主要玩家就是苹果、arm、高通。
如果不从季度出货量,而是从手机保有量来看不同gpu产品的市场份额,又是另外一番光景:
来源:deviceatlas
上面这份数据来自deviceatlas[4],发布时间在2019年年中。这份数据统计的是截至2019年第一季度,deviceatlas数据库中36个不同国家的gpu使用率。这份统计实际可能受到deviceatlas样本量的局限,不过它依然符合我们的基本认知。由于它考察的是手机保有量,而非当季最新出货量,所以仍有大量老设备活跃。其中powervr series7xt,实际是iphone 7时代的gpu。其他更多出现在榜单上的设备皆来自高通和arm。
下面的对比中,我们考察这些市场玩家最新推出的gpu旗舰产品,以及上一代gpu旗舰产品——除了苹果这样相对特殊的市场参与者,通常在gpu ip发布的半年到2年的时间里,实际的芯片产品才会问世,所以这些厂商的上一代gpu产品通常才是当前活跃在市场上的旗舰。
那么实际的对比对象就十分明确了,即:
• 苹果a13 bionic
• 苹果a12 bionic
• 高通adreno 650(高通骁龙865)
• 高通adreno 640(高通骁龙855)
• arm mali g77(三星exynos 990/联发科天玑1000)
• arm mali g76(三星exynos 9820/海思kirin 990、980)
• imagination powervr a-series
• imagination powervr series 9
需要注意的是,imagination的近两代ip实际上都没有具体的芯片产品问世,series 9xt的furian架构作为转瞬即逝的一代架构,很难做具体的量化,所以imagination powervr只会在本文稍稍带过。我们主要要对比的主角就是苹果、高通、arm。
话当年arm与竞争对手的巨大差距
arm mali gpu在性能和能效方面相较苹果和高通的差距,是的的确确存在于过往历史中的。2016年,高通骁龙835(adreno 540)时代,同场竞技的选手分别是苹果a11和arm mali g72/71。这时的arm mali gpu几乎被前两者吊打,无论是性能还是能效。
在此之前的arm mali gpu也基本处于被高通、苹果按在地上摩擦的水平。其中比较具有代表性的是海思kirin 960,这颗soc选择的是mali g71mp8方案。mali g71是最早采用bifrost微架构的一代gpu ip。
当时采用kirin 960的华为mate 9在跑t-rex霸王龙测试时(gfxbench),平均功耗达到了惊人的9.5w——要知道那会儿采用高通骁龙soc、散热设计最差的手机gpu平均功耗封顶也才5w,且骁龙821(adreno 530)只需要kirin 960不到40%的功耗就能达到相同的性能水平。在能效方面(perf/w),骁龙821的gpu(adreno 530)超过kirin 960(mali g71mp8)一倍还多。[5]
t-rex是alu算力需求较低,更偏向于texture纹理、填充率和三角形输出率的测试项目。而另一项知名的manhattan 3.1测试,kirin 960的情况也是惨不忍睹的。即便是一年以后的kirin 970(mali g72mp12)大幅提升了能效和性能,跑t-rex测试也同样需要同时代骁龙835(adreno 540)2倍以上的功耗,才可勉强达到差不多的图形计算性能,能效此时刚刚达到了骁龙835的一半。[6]
那会儿骁龙835的gpu平均功耗稳定在3.5-3.8w,相比前面几代都还在稳步降低;海思kirin与三星exynos这些采用mali gpu的soc则明显高于这个值一截。当时华为mate 10(kirin 970)跑manhattan 3.1测试的平均功耗远高于其可持续运行发热控制阈限所在的6.3w,t-rex测试可飙至接近8w。更气人的是,mali g71/g72沿用了midgard架构时代的texture单元,还在采用双线性过滤方案,所以游戏画质还落后于同时代的adreno gpu[7]。
那应该是高通adreno在性能与效率表现上最风光的年代,骁龙835(adreno 540)的峰值性能虽然没有同时代的苹果a11(iphone 8/x)彪悍,但持续性能达到了同等水平——galaxy s8的长时间游戏体验实际也强于iphone 8/x。
然而高通adreno相较苹果a系列的持平水准,以及相比arm mali的绝对领先优势在2019年的骁龙855身上逐渐丧失;不仅是苹果在gpu方面的持续发力,而且有arm的越来越逼近。
2019年的那些移动gpu
2019年的android旗舰主要采用的soc就是高通骁龙855(+)、华为海思kirin 990,以及三星exynos 9820。同代ios设备即iphone 11采用的是苹果自家的a13 bionic soc,gpu部分依然是苹果自研的ip方案。在对比跑分数据之前,还是先聊聊这几款产品(或ip)相比前代的一些变化。
bifrost架构前两代产品g71/g72相对灾难性的表现,在mali g76身上得到了极大程度的缓解。2018年3月,arm宣布推出mali g76时宣称,基于tsmc 7nm工艺的mali g76预计能实现性能50%的提升,性能密度提升30%、微架构效率提升30%。至于机器学习性能2.7倍提升就不是本文要探讨的重点了。
mali g76虽然仍是bifrost架构,但优化幅度还是比较大的。其中比较值得一提的是后端执行部分的加宽:g71/g72采用的是4-wide simd单元,每条lane处理单独的fma(fused-multiply-add,融合乘加)和add/sf(加法)管线;也就是说单周期wavefront宽度就是4指令;mali g76将其拓宽至8-wide,比先前加倍了alu单元数量。
arm一直在采用很窄的wavefront——可对比的是,我们在imagination a-series架构剖析中提到[2],a-series的这部分已经拓宽到了128-wide。arm采用这种较窄的方案,原因是期望避免线程发散(thread divergence)带来的alu闲置问题。不过较窄的wavefront(或warp size)带来的问题就是,与alu配套的控制逻辑电路更多,alu单元数量与控制电路之比更小。更宽的simd可以带来更好的芯片面积效益,实际相同芯片尺寸下也可以塞进更多的alu单元。4-wide就实际代码的线程发散来看,也实在没有必要。arm自己也说,现在的游戏gpu代码粒度需求和g71时期已经不大一样了。
与simd lane同时提升的,还有相应支持的cache和通路,以及像素、纹素(texel)硬件,保持先前相同的alu与纹理/像素单元的数量比值关系。g76实际上有些类似于把两个g72核心合并成一个核心,但实际所占的面积却比两个核心小得多。arm官方比较推荐的g76核心数目是12个,虽然这样的小核心数量仍然比苹果、高通adreno这些gpu多多了,但g76在走多核心、小核心的思路上已经发生了一定程度的转变。
g76相比前代的其他改进还包括增加int8的进一步支持——这应该主要是针对机器学习的;针对多边形回写操作,g76采用乱序回写机制,在发生回写停滞时具备了更好的操作弹性;其他调整还有针对tile buffer、线程本地存储机制等。
就arm自己纸面上对mali g76的宣传来看,这种提升其实是比较中规中矩的,并非大幅跨越。
有关高通adreno 640(骁龙855)能谈的理论部分则并不多,因为adreno对外界而言始终是个黑匣子,高通几乎不对外界披露太多有关adreno的技术细节。可分享的是高通提供的一些数据,包括相比上代提升20%性能(相比adreno 630);另外高通还在发布会上提到adreno 640增加了执行fp32、fp16操作的alu单元数量,增加50%。外媒anandtech曾推测adreno 630每个核心的alu数量是256个[8],总共2个核心。
那么这样算来adreno 640每个核心的alu数量为384个,双核总共768个(理论上adreno小升级应该不会再增加核心数)。alu lane数量增加和高通宣称20%的性能提升并不对等,所以预计adreno 640的频率可能是下降的。另外高通在《绝地求生》40fps演示中宣称功耗下降将近30%,未知这里的功耗指的具体是什么功耗。
adreno 640在特性方面包括支持真正的hdr游戏、physically based rendering(基于物理的渲染)游戏——通过更为准确的光线物理与材料交互,让游戏、虚拟现实提升真实性;图形管线支持10bit色深、rec 2020色域来实现hdr,支持hdr10+与dolby vision格式;支持120fps游戏、8k 360°视频回放。
来源:chiprebel[9],techinsights[10] via anandtech
这部分最后再来谈谈苹果a12/a13。苹果本身也很少公开自家gpu的技术信息。我们可挖掘的大致也就是通过die shot来做观察。a12的gpu部分看起来实则非常像a11——苹果a11采用的仍然是imagination的rogue架构gpu。a12采用的仍然是tbdr(基于tile的延后渲染)机制,这在移动gpu中比较有代表性的目前也就是imagination了;此外苹果也支持pvrtc纹理压缩(powervr texture compression)。有充分理由相信即便苹果2017年和imagination停止合作,其“自研”gpu也依然保留了imagination基因,只是双方的授权协议细节未知。
a12 gpu(iphone xs)一个较大的改进在于支持内存压缩,即从gpu到主内存的frambuffer压缩。苹果是支持gpu存储压缩特性,相对比较晚的一家soc厂商了。不过从实际效果来看,这个特性的加入的确让a12 gpu实现了很大程度的性能与效率提升。苹果宣称a12 gpu性能提升达到了50%,核心数目增加到4个。
a13 die shot,来源:anandtech[11]
a13 gpu(iphone 11)的die shot可见,最大变化在于后端alu模块和纹理单元,前端部分看起来是比较相似的;苹果宣称a13性能提升20%,相同性能下的功耗下降40%;另外苹果特别提到加强了soc散热能力:iphone x与xs的发热表现的确比较巨量。
adreno、mali、苹果gpu实际性能对比
以上基本都是理论分析,和厂商宣传中的性能提升。在此我们基于anandtech过去1年所做的测试,做gpu基准跑分汇总对比。
在测试对比的手机设备选择上,a12、a13显然就是iphone xs max与iphone 11 pro max这两款机型;arm mali g76的选择也比较简单,对应华为mate 30 pro(kirin 990),与三星galaxy s10+(exynos 9820)。
尤为值得一提的是,海思kirin 990的mali g76方案规模更大,海思采用的是16个核心的mali g76,频率约在600mhz(kirin 990 5g似有将频率提升至700mhz);三星exynos 9820的gpu配置为mali g76mp12,频率约在702mhz。
adreno 640(骁龙855)的终端设备选择比较多样,而且不同手机制造商对adreno 640的系统设计所呈现的性能、效率差别实则是比较大的。这里我们选择实施方案比较有代表性的几款机型,分别是一加7 pro,谷歌pixel 4 xl,以及黑鲨2、三星galaxy s10+(骁龙855版)。通过多款机型的对比,实则也能看出oem制造商在系统、散热设计方面的功力。
需要注意的是,这几款gpu(及对应的soc),以及手机上市的时间是不一样的,跨度可能超过了半年;而且手机由于屏幕尺寸差异,散热效率的基础也不一样——屏幕尺寸有市场定位导向,并不是厂商可任意做大的;针对不同细分市场也存在手机散热设计、温控机制等差别,比如黑鲨2是游戏定位的,它以牺牲手机轻薄性为代价做整体系统设计,理论上可以获得更好的性能表现(但似乎也只是理论上)。
这里还需要强调一点,苹果a13的制造工艺会更先进,而三星exynos 9820则相较其他soc的制造工艺都略逊一筹,为8nm lpp。所以并不能简单说,谁跑分更高、谁的设计就一定更优秀。且测试仍涉及软件、系统、驱动层面,所以这里的对比可能并不严谨。
测试项目选择是anandtech常规的几项,包括了3dmark sling shot 3.1 extreme unlimited – physics/graphics
数据汇总自anandtech
在以上测试项中,我们认为最能表现gpu图形计算能力的,就是gfxbench manhattan(曼哈顿),t-rex(霸王龙),以及aztec ruins高画质测试场景,测试结果单位为帧率(fps,每秒帧数)。不过这几个测试都有自己的偏向性,比如t-rex测试相对而言更偏向gpu纹理与填充率吞吐表现,而manhattan则属于shader核心重型任务。图表中橙色柱状条表示持续性能,蓝色表示峰值性能。
需要指出的是,峰值性能并不是没有意义的。苹果在早期宣传中更喜欢谈持续性能——即持续长时间跑图形计算高负荷任务的稳定性能状态,因为这对于游戏的实际体验才是更有价值的数据。但从iphone xs开始,苹果也越来越关注设备的峰值性能,因为峰值性能追求的是瞬时突发性能:iphone在大量场景实际都依赖gpu计算,包括app中的通用硬件加速,甚至拍照处理的gpu计算——这类场景更看重突发性能,需要尽最快速度处理一些固定负载任务。gpu的这种通用性,令其峰值性能成为需要考察的重要指标。android系统近些年实则也一直在这方面努力。
从我们汇总的柱状图不难发现,苹果a12/a13在gpu性能方面是独占鳌头的,其他表现最出色的gpu峰值性能才刚刚达到了a12的持续性能。
而高通adreno 640组(中间4款设备)与arm mali g76组(最后2款设备)的对比,至少就性能来看是很难简单分出伯仲的。尤其我们看到华为mate 30 pro在mali g76的方案实施中表现出了完全能够和adreno 640比肩的性能水平,持续性能甚至比绝大部分adreno 640机型表现更出色。
而且海思kirin 990这一代mali实施方案,也真正实现了对三星exynos的超越——这在以往也是比较少见的,因为前些年三星总能在同代arm mali实施方案中领先于海思。不过这一点仍需要考虑到kirin 990的gpu是在kirin 980基础上的一次改良,且kirin 990推出时间远晚于三星exynos 9820。
值得一提的是,虽然一加7 pro在持续性能和峰值性能方面看来十分接近,也表现出了adreno 640机型的最佳水准,但这和一加7 pro温控机制十分激进有关——这款手机允许屏幕表面温度飙升到51℃,所以其持续性能会明显强于其他android机型。可对比的是galaxy s10+温控会将设备表面温度控制在42-43℃之间;华为mate 30 pro则在45℃上下。这组数据中另外比较奇怪的是黑鲨2,这是一款定位玩游戏的手机,但anandtech测试中,其温控非常保守,导致黑鲨2在整个adreno 640(骁龙855)阵营中都属于性能较弱的水平。
来源:anandtech
性能表现之外,gpu的功耗和效率也很重要。这里选择manhattan与t-rex测试的系统有功功率(从设备总功耗中减去相应负载场景的闲时功耗),以及最终的效率来做对比——这是以往arm mali被苹果和高通碾压的绝对弱势项(主要可以参见表中最末一位的exynos 8895)。
iphone这两年若单论gpu突发以及平均功耗(第四列avg. power),可以说是高得惊人的,尤其a12快速推升到高性能的动作,会将3dmark跑到崩溃,崩溃前的瞬时功耗可达7-8w;a13已经收敛不少,但峰值功耗依然可超过6.2w。上表中,iphone后面的“warm”表示在测试项跑过3遍以后,整体gpu性能会下降并趋于稳定,这个状态下的功耗会更加合理;而“cold/peak”则表示设备温度较低时,初始跑测试可达到的状态。
苹果a12(iphone xs max)在用户体验方面并不算好,主要原因是在gpu任务负载伊始,就倾向于快速达到满负荷运转状态,并致设备在使用的前几分钟就明显升温。实际上苹果gpu的持续性能已经足以应付大部分工作,而不需要在很多时候这么“拼”。苹果在a13这一代更偏着力在温控方面,体验也就比a12好了很多。
即便如此,如果看能效——即性能成绩÷功率=每瓦性能(上表中的最后一列),则a12/a13 gpu部分依然能够甩开其他竞争对手很远的距离。在达到与a12 gpu相同性能水平下,a13 gpu的功耗低了32%——虽然没有苹果吹的40%那么厉害,但也已经十分优秀。
过去高通adreno虽然在绝对性能上无法与苹果ax gpu相提并论,但在能效方面,高通离苹果还是十分接近甚至不相伯仲的。但在最新一代产品中高通似乎已经被苹果甩开了一段距离。t-rex测试中,骁龙855版galaxy 10+的gpu能效水平为40.70fps/w,相较稳定状态下的a13差距达到了将近50%。
更糟糕的是,mali g76似乎已经在游戏图形计算效率方面达到了与adreno几乎持平的水平。mali对adreno的步步紧逼,实则更体现在2018年的上一代mali g76产品上,同样采用mali g76的海思kirin 980(但实施方案与kirin 990有差异),当时宣称gpu能效(power efficiency)提升178%——2018年anandtech针对kirin 980 gpu(mali g76mp10)的测试发现,在gpu满载状态下,平均能效提升相比kirin 980(mali g72)达到了100%,如果按照相比kirin 970同等性能时的功耗与效率来看,则其gpu能效提升的确可能达到了华为宣传中的178%,这在行业内都是相当罕见的提升幅度。
不过kirin 980的gpu依然在性能和效率方面落后于同代骁龙845,部分测试的能效成绩与骁龙835接近。但此时的差距已经比kirin 970时期缩小了非常多。到kirin 990在gpu能效方面的表现,就aztec与manhattan测试已经能够和骁龙855打得有来有回,甚至部分超越(不过这与不同手机设备的具体情况仍然相关),这在以往是从来没有过的。
最后再来看看3dmark sling shot 3.1 extreme unlimited – physics/graphics测试,这两项测试侧重考察的性能重点与前面的测试不同,3dmark physics测试实际上是3d负载中偏cpu性能的测试。华为mate 30 pro表现出了最出色的成绩,这和cortex a76的prefetcher加强,以及kirin 990本身的存储子系统加强有关;graphics偏重图形测试,苹果仍然表现出了不错的成绩,对骁龙855实施比较激进的一加7 pro也表现不错。
需要再次强调的是,测试结果与系统、软件版本都有关系,iphone在3dmark测试中的表现普遍并不算出色,必然是遇到了一些瓶颈的;基于iphone xs max,在ios 12与13两套系统中的3dmark graphics测试结果上就存在20%的差别。所以上述结果和展示方法并不严谨。
不过在以上整体对比中,我们甚至可以认为,图形计算头一次不再成为arm mali,以及海思kirin soc的软肋。这和两年前的状况已大不相同。
不过以上我们并没有对比gpu的“面积效率”或“性能密度”,比如苹果a13的gpu部分总面积达到了15.28mm²,这是相较大部分移动gpu都明显更大、成本更高的方案。高通骁龙和adreno系列近些年都是以小尺寸著称的。
三星exynos 9820与海思kirin 990 5g die shot,分别来自chiprebel[13]与techinsights[14],标注是由anandtech进行的
从techinsights公开的信息来看,骁龙855的die size为73.27mm²,这是主流soc中相当小的方案。只是没有研究机构公开对骁龙855 die的模块labeling,所以我们不清楚adreno 640大致占到其中多大的面积。可参考骁龙845的adreno 630占地面积为10.69mm²[15]——考虑到adreno 640加大了后端,其尺寸理论上会更大。
而上图分别是exynos 9820与kirin 990 (5g版)的die shot。exynos 9820的die size大约是127mm²;kirin 990 5g的整体die size约为113mm²。kirin 990 5g虽然采用的制造工艺更先进,但因为gpu规模更大,目测实施方案的占地面积可能会大于exynos 9820的方案,整体应该是差不太多的。
imagination在上个月的发布会上提到,exynos 9820的mali g76mp12用184%的面积,才达到与骁龙855 adreno 640相同的性能——如果这个数据是准确的,那么高通目前仍然在面积效率方面具有相当的领先优势,即便mali gpu已经在性能和能效方面做到了几乎与adreno齐头并进。这一点我们猜测与arm mali仍然采用较窄的wavefront(或warp size),以及小核心、多核心的思路有关。
2020年的移动gpu展望
2019年年中,arm发布mali g77,我们之前也已经在《arm新版mali gpu简析:这次终于赶超高通和苹果?》一文中对mali g77的架构改进做了比较具体的阐述[1]。这次在架构层面的改进幅度还是相当之大的,新的valhall架构进一步将执行引擎的wavefront size(或warp size)增加到16-wide;以前的3个执行引擎合并后分成两条alu管线,每条有各自的fma相关单元(融合乘加单元,也就是每个核心32个fma);tmu单元(纹理贴图单元)吞吐能力翻番。
arm当时提到,g77的性能密度提升30%(每mm²性能提升1.2-1.4倍),能效提升30%(每瓦性能提升1.20-1.39倍);综合峰值图形性能预计可提升40%——这个值当然与不同厂商的实施方案还将息息相关。
前不久,高通也发布了最新的骁龙865及与其配套的adreno 650。比较令人在意的是,高通今年的adreno仍然停留在600系列——这样一来,这已经是高通连续第三年采用adreno 600系列来为产品冠名了,这在以前似乎是从没有过的,可见这代升级仍然并不是什么太大幅度的升级。
高通提到,adreno 650还将继续增加alu单元+50%,以及像素渲染单元+50%(每个时钟周期处理+50%的像素,也就是rop光栅化处理),预计总体性能提升为25%。如果说alu单元数量增加50%,推测adreno 650的核心数可能要增加一个,或者也可能是单核alu数量变为512个;rop单元也增加的话,最终讲改变处理纹素:像素单元比例。而在功耗与效率方面,高通表示在相同性能水平下,adreno 650效率会高出35%;另外持续性能会明显优于adreno 640。
anandtech对骁龙865的参考设计机型做了测试[16],仅有峰值性能数据。这里只摘录其中的manhattan 3.1与t-rex 2.7测试项,其gpu性能水平如上图所示。测试结果基本符合高通所说的25%性能提升,峰值性能优于2019年的adreno 640与mali g76,但仍未达到苹果a12的水平。其能效(perf/w)接近a12的水平,领先于mali g76与adreno 640——这一点当然也是必然的,这里不再给出详细数据。
值得一提的是,最终骁龙865手机依然会由于oem厂商在实施方案上的差别而存在性能与能效的差异,所以这个数据只能作为参考。
25%的性能提升实际是年度迭代比较符合常规的数字,不过如果arm宣传中提到的mali g77性能与能效提升水平的确能够实现,那么高通的这点提升将不具有竞争力——至少在性能与功耗效率方面,adreno在2020年有被mali赶超的可能性,高通正逐渐丢失往日相较arm在图形计算方面的绝对优势地位;且与苹果存在越来越大的差距。
最后仍然需要提到imagination,虽然imagination近些年在移动gpu的市场份额方面还在逐年萎缩,但在gpu性能与效率上却是个十分恐怖的竞争对手,尤其在前一阵powervr a-series新架构发布以后,我们也已经对新架构做了相对详细的解析[2]。
imagination宣称,如果将adreno 640的占地面积和性能均视作100%,则mali g76需要184%的面积才能达到100%的性能;而a-series gpu可以“更小、更低的功耗”实现175%的性能。这个数字实则远超今年即将大规模上线的高通adreno 650,以及arm mali g77。
而且就在这两天,imagination刚刚宣布苹果再度与其签署多年授权协议,未来苹果a系列芯片的gpu仍能见到imagination的ip方案,虽然我们不清楚个中合作细节,苹果目前“自研”的gpu ip中也还能见到rogue架构的影子。但或许,苹果对于imagination这次发布的a-series,以及规划中的b-series、c-series、d-series都十分感兴趣。
而苹果与imagination恢复合作,预计还将促成更多soc制造商与imagination的合作。这将成为刺激移动gpu市场推进的又一大变数。在2020年的移动gpu市场上,高通大概是现如今最需要重整旗鼓的市场玩家了。
LED温度指示器电路图分析
AC/DC 转换电路设计的课题和探讨事项-认证、规范等
行业方案|通信设备行业SRM供应商协同管理系统解决方案
深度学习在人工智能领域的前世今生
C运算符的优先级和结合性详细解决
华为和高通的GPU到底还有多大的差距
Siri音箱已经开始生产?将在WWDC 2017上发布
安科瑞安全智能的配电房运维系统方案
5分钟开发智能单车,机智云4.0加速物联网设备开发
单个分子的数据存储如何使用
Wowza:视频技术的未来—大趋势
圣邦微电子推出一款高精度、低噪声、大电流输出运放SGM8557H-1AQ
高效率大功率T型三电平IGBT方案
Wi-Fi 6传输范围广速度快,将成为新一代无线认证标准
固态电解质中锂驱动应力变化监测
欧盟出台政策围堵中国 半导体发展孤立无援
我国锂电行业机器视觉赛道的四种趋势
5G+VR技术推进智慧医疗加速落地
NVIDIA Jetson Nano 2GB:视觉类脚本的环境配置与映射
vivo X23将采用美人尖式的全面屏,四周边框极窄