全球手机处理器架构进化论:从ARM9到A15

随着智能手机越来越普及,消费者在选购手机的时候也越来越理性化,除了关心价格和外观之外,手机的性能也成为了人们最关心的因素,大家都知道, 处理器是影响手机性能的最关键的因素,像德州仪器、高通、英伟达以及三星等主流的处理器厂商,大家都已经耳熟能详。但是很多人并不知道,其实它们采用的都 是同一个架构——arm架构,实际上,处理器采用的架构才是影响处理器性能的关键因素。今天,笔者就和大家一起,聊一聊arm的那些事。
arm架构简介
arm(advanced risc machine的缩写)架构,被称作进阶精简指令集机器,是一个32位精简指令集(risc)处理器架构,其广泛地使用在许多嵌入式系统设计。由于低成本、高效能、低耗电的特性,arm处理器非常适用于移动通讯领域。
为了大家更好的理解,我们不妨做个比喻,arm架构就像是一座建筑的结构设计部分,而处理器就相当于一个完整的建筑,只有有了稳定的结构作为基 础,才能建造出各式各样的房子。换句话说,arm架构只相当于一座建筑的框架,至于最后建造出来的房子长什么样,舒适度如何,就是由处理器厂商自己决定 了。不过有一点需要说明,假如结构的设计值是十层,容纳人数的上限是100人,那么最后建好的房子也不能超过这个上限。这也就是说,采用相同架构的处理 器,性能基本上已经锁定在一定的范围之内,不会有本质的区别。所以,看处理器的性能要先看架构。
arm架构
arm授权方式
arm公司是一家知识产权供应商,本身并不参与终端处理器芯片的制造和销售,而是通过向其它芯片厂商授权设计方案,来获取收益。arm提供了多 样的授权方式,arm公司可以向芯片厂商单纯的转让设计方案的使用及销售权,比如德州仪器,其旗下的omap处理器是在原始arm架构的基础上设计的,这 种方式费用一般比较低,所以,德州仪器的芯片售价也相对较低。
对于一些具备自有设计技术的客户,他们希望能对原始的arm架构进行优化,以便更好的适应到自己研发的芯片,这样就会牵扯到授权架构修改的费 用,而且这项费用也是相当昂贵的。比如高通scropion架构,三星的蜂鸟hummingbird核心等都是在cortex-a8的基础上修改的。一般 这些优化过的处理器都要比采用原始arm架构的处理器性能更强。
采用arm架构的品牌
arm公司是全球最大的半导体知识产权核心供应商,目前已经在移动电话领域占据了90%的市场份额。超过100家半导体公司持有不同形式的 arm授权。其中包括intel、ibm、lg、nec、sony、nxp(原philips)和ns等公司。也有包括微软、升阳和mri等一系列知名软 件系统公司。
arm的设计是acorn电脑公司(acorn computers ltd)于1983年开始的开发计划。1985年时开发出首款内核arm1,经过三十年的发展,如今已经发展到运行速度可达2.5ghz的crotex- a15核心。接下来笔者就为大家介绍一下arm架构的发展历程。因为arm9之前的arm核心基本上都是应用在音乐播放器、游戏机、相机以及计算器等电子 产品中,所以这部分笔者就不做过多介绍了,以下笔者着重介绍在智能手机中广泛应用的arm9及之后的arm架构。
arm9 处理器系列
arm9系列于1997年问世,arm9处理器系列包括arm926ej-s、arm946e-s和arm968e-s处理器。
arm926ej-s™ 处理器具有一个采用jazelle®技术的增强型32位risc cpu、灵活的大小指令和数据高速缓存、紧密耦合内存(tcm)接口和内存管理单元(mmu)。它还提供单独指令和数据amba®ahb™ 接口,适合基于多层ahb的系统。arm926ej-s处理器可执行armv5tej指令集,其中包括功能得到增强的16 x 32位乘法器,可进行单周期mac运算,以及16位定点dsp指令,可增强多个信号处理应用程序的性能并支持 thumb® 技术。
arm9内核
arm926ej-s处理器为入门级处理器,可支持完全版操作系统,其中包括 linux、windows ce和symbian。因此,此处理器是众多需要完整图形用户界面的应用的理想之选。arm926ej-s被广泛的应用于智能手机处理器中。其中德州仪器 omap1系列处理器、高通msm6***系列处理器以及飞思卡尔、恩智浦半导体等都采用了arm926ej-s内核。
采用arm926ej-s内核的产品
智能手机当中,诺基亚的大部分symbian s60系统的智能手机,索尼爱立信k系列以及walkman系列音乐手机,以及明基西门子和lg部分手机都采用了arm926ej-s内核。
采用ti omap 1710处理器的手机
omap 1710是一款采用arm926ej-s内核的处理器,也是ti公司第一款采用90纳米制程的处理器,制程的减小也就意味着工作电压的下 降,omap1710已经可以在1.05—1.3v之间动态调整,而普通待机状态下的耗电量仅为10mah,在当时来说,可谓节能高手。omap1710 最大工作频率可以达到220mhz,一级缓存已经提升为32kb。这样的性能在当时来说是相当强大的,当年诺基亚大部分智能手机都是采用的这颗核心,这些 手机包括:诺基亚6630、6680、6681、e50、e60、e61、e62、e65、e70、n70、n71、n72、n73、n80、n90、 n91、n92以及三星的sgh-i600、sgh-i607等,不过现在这样的性能已经明显过时了。
arm11处理器系列所提供的引擎可用于当前生产领域中的很多智能手机;该系列还广泛用于消费类、家庭和嵌入式应用领域。该处理器的功耗非常 低,提供的性能范围为小面积设计中的350mhz到速度优化设计中的1ghz(45纳米和65纳米)。arm11处理器软件可以与以前所有arm处理器兼 容,并引入了用于媒体处理的32位 simd、用于提高操作系统上下文切换性能的物理标记高速缓存、强制实施硬件安全性的trustzone以及针对实时应用的紧密耦合内存。
arm11结构图
arm1136j-s发布于2003年,是针对高性能和高能效的应用而设计的。arm1136j-s是第一个执行armv6架构指令的处理器, 它集成了一条具有独立的load-store和算术流水线的8级流水线。armv6指令包含了针对媒体处理的单指令多数据流(simd)扩展,采用特殊的 设计以改善视频处理性能。arm1136jf-s就是为了进行快速浮点运算,而在arm1136j-s增加了向量浮点单元。
ti omap 2处理器
德州仪器omap2系列处理器采用了arm1136架构,其中ti omap 2420能管理130—400万像素的摄头和qvga(240×320)分辨率的屏幕,支持蓝牙、红外和高速usb传输,兼容a-gps定位功能,可利用 wlan功能无线上网,支持第三方sd、mmc存储卡扩展,并可使用sd i/o设备,能处理400万甚至更高像素的静态图片,能够记录30帧/秒的vga(640×480)像素动态有声视频文件,能提供接近hi-fi级的3d 环绕音效,支持tv-out输出功能,每秒可以计算200万个多边形。代表产品为诺基亚n82、n93、n95等。
高通骁龙s1处理器
高通骁龙snapdragon s1是针对当今大众市场的智能手机所开发的处理器,该处理器运算速度最高可达1ghz主频,是全球首款达到1ghz主频的移动单核产品。采用了65nm工 艺并集成adreno 200图形处理器(gpu),采用arm11架构的处理器型号msm7627/7227(主频为600-800mhz)和msm7625/7225(主频 为528mhz)。
tegra处理器
tegra apx 2500芯片的制程是65纳米,核心频率750mhz,并集成256kb的l2缓存。芯片亦内建geforce核心,支持opengl es 2.0和direct3d mobile标准。apx 2500属于arm 11 mpcore架构,其低耗电设计,使手提电话可以长时间播放音乐或高清影片。此外,它支持720p的mpeg-4与h.264/mpeg-4 avc的解码。输出方面,它支持hdmi 1.2和双显示输出。之后推出的tegra apx 2600在apx 2500基础上增强了对nand闪存的支持。2009年微软推出的zune hd中使用了tegra apx 2600芯片。
tegra 600和tegra 650两款型号,整合arm 11 mp core、影音处理器,tegra 600支持720p h.264和vc-1影片解码,tegra 650更支持1080p影片解码。该系列目前已停产。
arm11处理器系列所提供的引擎可用于当前生产领域中的很多智能手机;该系列还广泛用于消费类、家庭和嵌入式应用领域。该处理器的功耗非常 低,提供的性能范围为小面积设计中的350mhz到速度优化设计中的1ghz(45纳米和65纳米)。arm11处理器软件可以与以前所有arm处理器兼 容,并引入了用于媒体处理的32位 simd、用于提高操作系统上下文切换性能的物理标记高速缓存、强制实施硬件安全性的trustzone以及针对实时应用的紧密耦合内存。
arm11结构图
arm1136j-s发布于2003年,是针对高性能和高能效的应用而设计的。arm1136j-s是第一个执行armv6架构指令的处理器, 它集成了一条具有独立的load-store和算术流水线的8级流水线。armv6指令包含了针对媒体处理的单指令多数据流(simd)扩展,采用特殊的 设计以改善视频处理性能。arm1136jf-s就是为了进行快速浮点运算,而在arm1136j-s增加了向量浮点单元。
ti omap 2处理器
德州仪器omap2系列处理器采用了arm1136架构,其中ti omap 2420能管理130—400万像素的摄头和qvga(240×320)分辨率的屏幕,支持蓝牙、红外和高速usb传输,兼容a-gps定位功能,可利用 wlan功能无线上网,支持第三方sd、mmc存储卡扩展,并可使用sd i/o设备,能处理400万甚至更高像素的静态图片,能够记录30帧/秒的vga(640×480)像素动态有声视频文件,能提供接近hi-fi级的3d 环绕音效,支持tv-out输出功能,每秒可以计算200万个多边形。代表产品为诺基亚n82、n93、n95等。
高通骁龙s1处理器
高通骁龙snapdragon s1是针对当今大众市场的智能手机所开发的处理器,该处理器运算速度最高可达1ghz主频,是全球首款达到1ghz主频的移动单核产品。采用了65nm工 艺并集成adreno 200图形处理器(gpu),采用arm11架构的处理器型号msm7627/7227(主频为600-800mhz)和msm7625/7225(主频 为528mhz)。
tegra处理器
tegra apx 2500芯片的制程是65纳米,核心频率750mhz,并集成256kb的l2缓存。芯片亦内建geforce核心,支持opengl es 2.0和direct3d mobile标准。apx 2500属于arm 11 mpcore架构,其低耗电设计,使手提电话可以长时间播放音乐或高清影片。此外,它支持720p的mpeg-4与h.264/mpeg-4 avc的解码。输出方面,它支持hdmi 1.2和双显示输出。之后推出的tegra apx 2600在apx 2500基础上增强了对nand闪存的支持。2009年微软推出的zune hd中使用了tegra apx 2600芯片。
tegra 600和tegra 650两款型号,整合arm 11 mp core、影音处理器,tegra 600支持720p h.264和vc-1影片解码,tegra 650更支持1080p影片解码。该系列目前已停产。
arm公司在经典处理器arm11以后的产品改用cortex命名,并分成a、r和m三类,旨在为各种不同的市场提供服务。
cortex系列属于armv7架构,这是arm公司最新的指令集架构。armv7架构定义了三大分工明确的系列:“a”系列面向尖端的基于 虚拟内存的操作系统和用户应用;“r”系列针对实时系统;“m”系列对微控制器。由于应用领域不同,基于v7架构的cortex处理器系列所采用的技术也 不相同,基于v7a的称为cortex-a系列,基于v7r的称为cortex-r系列,基于v7m的称为cortex-m系列。
cortex-a5是cortex-a家族中最低端的,其特点是功耗较低,单位功耗的效能很高,性能优于arm9和arm11,适合应用在千元级的低端产品市场。
cortex-a5结构图
cortex-a5内部核心数目1-4核可选,同时与cortex-a8一样内部使用了trustzone安全技术以及neon多媒体处理引 擎,并能与 cortex-a8/a9处理器实现完全的应用兼容。采用四核配置时,soc芯片内部还可搭配mail gpu或由用户按需求配用powervr mbx/sgx gpu。
cortex-a5架构功耗、性能、面积
cortex-a5处理器和cortex-a8与cortex-a9一样基于arm v7架构,采用40nm低功耗制程技术制作,默认工作电压1.1v,单核核心频率480mhz,四核核心频率可达1ghz,含缓存的核心面积最小仅1平方 毫米,一级缓存容量最大64kb,功耗/频率比参数为0.12mw/mhz。
相比之下cortex-a8处理器则采用65nm制程工艺制作,核心频率650mhz(65nmlp工艺)/1.1ghz(65nm gp工艺),内建二级缓存,二级缓存最大容量为1mb,一级缓存同为最大64kb。功耗/频率比参数为0.59/0.45mw/mhz。
高通骁龙s1处理器
高通骁龙s1部分处理器采用了cortex-a5架构,其中msm7627a/7227a(主频为0.8-1.0ghz)和msm7625a/7225a(主频为0.6-0.8ghz)。
arm cortex-a8处理器是第一款基于armv7架构的应用处理器,cortex-a8处理器的速率可以在600mhz到超过1ghz的范围内调节,能够 满足那些需要工作在300mw以下的功耗优化的移动设备的要求;以及满足那些需要2000 dhrystone mips的性能优化的消费类应用的要求。
cortex-a8处理器是arm的第一款超标量处理器,具有提高代码密度和性能的技术,用于多媒体和信号处理的neon™技术,以及用于高效地支持预编译和即时编译java及其他字节码语言的jazelle®运行时间编译目标(rct)技术。
cortex-a8结构图
ti omap3系列处理器采用了arm cortex-a8架构,可提供比基于arm 11的处理器多至三倍的性能增益,同时使得3g手持终端具有可与笔记本电脑媲美的生产力以及先进的娱乐功能。作为业界第一个将采用65nm cmos工艺设计的应用处理器,omap 3430在降低内核电压并增加了降低功耗的特性的同时比以前的omap处理器系列具有更高的工作频率。omap 3430的代表产品为摩托罗拉里程碑、xt711、三星i8910、诺基亚n900、palm pre等。可以运行在800mhz的处理器omap 3440的代表产品则为摩托罗拉xt720,archos 5等。
ti omap 3xxx处理器
omap 36x系列同样采用了arm cortex-a8架构,不过应用了更先进的45纳米制造工艺,其中omap 3630主频720mhz,omap 3640主频1ghz。集成了powervr sgx530 gpu。德州仪器omap 36x系列的代表产品有摩托罗拉droid x、droid 2/里程碑2、defy/me525、defy+,archos 7,诺基亚n9等。
高通scorpion架构
scorpion(天蝎座)是高通自家设计的基于cortex-a8架构的处理器架构,并使用arm v7的指令集,具备了13阶load/store管线,还有两个整数处理管线,目标时脉是设定在1ghz。至于scorpion中的simd资料路径,不 用时可关掉一半,效能会好一些。目前已有htc desire、htc hd2、sony ericsson x10、acer liquid加入snapdragon阵营。dell的平板电脑stream采用第一代snapdragon。第二代snapdragon芯片制程从65 纳米进入45纳米,时脉也从1ghz提升至1.3ghz。
高通骁龙snapdragon s2产品系列
高通骁龙snapdragon s2全部采用45nm工艺制程,主频提升至1.4ghz,集成adreno205 gpu,支持hspa+高速网络,以及支持720p高清视频播放。并且功耗相比第一代处理器降低30%。
高通骁龙snapdragon s2是针对高端单核智能手机而设计的。其特点在于拥有最新设计和优化的多媒体子系统。整体性能以及电源管理能力上都有了很大的提升。
msm8655/8255为1-1.4ghz的scorpion处理器,用于高端单核智能手机。代表机型:索尼爱立信lt18i和htc desire s。
msm7630/7230为0.8ghz的scorpion处理器,虽然频率不高,但由于采用了新的工艺和设计,性能上比第一代1ghz的处理器性能更强。代表机型:华为u8800。
高通骁龙snapdragon s3产品系列
高通骁龙snapdragon s3为1.2-1.5ghz双核scorpion处理器,依然采用了45nm工艺,由于采用异步的处理方式,在能耗方面比其他的双核处理器会有比较明显的优势。
msm8660/8260采用了双核scorpion处理器,主频1.2-1.5ghz。用于高端双核智能手机,代表机型htc sensation和小米手机。
三星hummingbird核心
三星蜂鸟hummingbird核心同样是在cortex-a8基础上,进行修改增强的一款核心,采用这款核心的代表产品便是三星 s5pc110/s5pv210苹果a4核心。而hummingbird核心也正是三星和苹果合作研发而来。在实测性能上,较其它普通a8核心的cpu 相比,拥有了成倍的增长。
三星蜂鸟hummingbird处理器
三星s5pc110/s5pv210可以说是世界上最强的cortex-a8架构方案芯片,它在原cortex-a8的基础上,进行了大幅度 的优化,在性能上也获得了大幅度的增长,基本上,能够达到同等架构的cpu效能的1倍以上。采用该处理器的机型有三星i9000,魅族m9等。
苹果a4处理器
苹果a4处理器
苹果iphone 4和苹果ipad以及itouch 4都采用了这个和三星s5pc110处理器相近的a4处理器,不过苹果作了更多的优化,尤其是苹果a4将负责视频硬解的vxd370改成了 vxd375,gpu和内存的直连也令powervr 535的实际表现要超越三星s5pc110的powervr 540处理器。但归根结底,苹果a4处理器还是一个基于arm cortex-a8核心的高性能处理器。
cortex-a9是性能很高的arm处理器,可实现受到广泛支持的armv7体系结构的丰富功能。cortex-a9 处理器的设计旨在打造最先进的、高效率的、长度动态可变的、多指令执行超标量体系结构,提供采用乱序猜测方式执行的 8 阶段管道处理器,凭借范围广泛的消费类、网络、企业和移动应用中的前沿产品所需的功能,它可以提供史无前例的高性能和高能效。
arm cortex-a9 性能、功耗和面积
cortex-a9 微体系结构既可用于可伸缩的多核处理器(cortex-a9 mpcore™ 多核处理器),也可用于更传统的处理器(cortex-a9 单核处理器)。可伸缩的多核处理器和单核处理器支持 16、32 或 64kb 4 路关联的 l1 高速缓存配置,对于可选的 l2 高速缓存控制器,最多支持8mb的l2高速缓存配置,它们具有极高的灵活性,均适用于特定应用领域和市场。
ti omap 44xx处理器
2011年推出的omap 4430是德州仪器公司的首个双核处理器型号,采用双核心arm cortex-a9 mp架构,相比cortex a8内核整体提升了1.5倍的性能。omap 4430在同级双核里被喻为性能最优秀的处理器,拥有tegra 2没有的neon模块,拥有比e4210更小的发热量,拥有比msm8260更优秀的构架,所以拥有“怪兽级”双核处理器之称。omap 4430的代表产品有lg optimus 3d,摩托罗拉里程碑3、xt883,三星 i9100g,黑莓playbook等。
tegra 2芯片
在ces2010展会上,nvidia发布了全新的tegra 2平台,这是全球首款双核处理器,将智能手机带进了双核时代,tegra 2跳过了arm cortex-a8的阶段,直接采用arm cortex-a9核心,采用台积电的40纳米制程制造,耗电量低于之前产品,tegra 2可实现更快web浏览速度、更短响应时间以及更高整体性能,而且还支持高清hd视频播放和hdmi接口。
tegra 3四核处理器
tegra 3虽然名为“四核”,但是实际上内部包含了5个cpu核心,其中一个被称为“companion cpu core”协核心。nvidia将这种架构称为vsmp(可变对称多处理,variable symmetric multiprocessing)。tegra 3中的5个cpu核心均为cortex-a9架构。不过,其中四个主要核心最高可支持1.4ghz主频。而最后一个协核心最高频率仅500mhz。
在cortex-a9双核处理器初见端倪之后,arm再次给大家带来惊喜,那就是arm可能会推出一款四核芯片,最快处理速度能够达到 2.5ghz,初步得知,这款处理器型号为cortex-a15。 在还未上市的智能手机芯片当中,cortex-a15可能是目前听说的主频最高的双核芯片了,据说,这款芯片除了将手机cpu运行速度提升至2.5ghz 以外,还可以支持超过4gb的内存,能力相当的惊人,不过可能离我们还有一段距离,毕竟如此强劲的芯片的只有在更加强悍的硬件、软件的支持下,才能够正常 的发挥作用。
arm cortex™-a15
arm cortex™-a15 mpcore™ 处理器提供前所未有的处理功能,与低功耗特性相结合,在 arm 的各种新市场和现有市场上成就了卓越的产品,这些市场包括移动计算、高端数字家电、服务器和无线基础结构。
cortex-a15 mpcore 处理器是 cortex-a 系列处理器的最新成员,确保在应用方面与所有其他获得高度赞誉的 cortex-a 处理器完全兼容。这样,就可以立即访问已得到认可的开发平台和软件体系,包括 android™、adobe® flash® player、java platform standard edition (java se)、javafx、linux、microsoft windows embedded、symbian 和 ubuntu 以及 700 多个 arm connected community™ 成员,这些成员提供应用软件、硬件和软件开发工具、中间件以及 soc 设计服务。
cortex-a15 mpcore 处理器具有无序超标量管道,带有紧密耦合的低延迟 2 级高速缓存,该高速缓存的大小最高可达 4mb。浮点和 neon™ 媒体性能方面的其他改进使设备能够为消费者提供下一代用户体验,并为 web 基础结构应用提供高性能计算。
预计 cortex-a15 mpcore 处理器的移动配置所能提供的性能是当前的高级智能手机性能的五倍还多。在高级基础结构应用中,cortex-a15 的运行速度最高可达 2.5ghz,这将支持在不断降低功耗、散热和成本预算方面实现高度可伸缩的解决方案。
ti omap 54xx处理器
omap 5高级多核架构包含各种内核,其中包括arm通用处理器、多个图形内核和多种专用处理器,用于平衡可编程性、性能和功耗。omap 5提供了两套方案:omap5430、omap5432,旨在满足客户的不同需求。
这两款设备都采用ti定义的低功耗28纳米制造工艺,同时拥有两个arm cortex-a15 mp内核处理器,主频均具有高达2ghz的速度,两个arm cortex-m4处理器可实现低功耗负载和实时响应。omap 5430适用于要求最小尺寸的产品(例如智能手机),支持双通道、lpddr2堆叠封装 (pop) 内存。omap5432适用于移动计算和消费产品,它们要求更低成本,没有极端的尺寸限制,支持双通道 ddr3/ddr3l 内存。
结束语:
今天笔者为大家介绍了一下arm架构的发展历程,相信大家对arm架构已经有了一定的了解。我们可以看到,随着智能手机的普及,arm架构也发 展的越来越快。再过不久,采用cortex-a15的四核处理器就要和大家见面了。到底cortex-a15能够发挥出多大的能量呢?让我们拭目以待吧。

国产核心部件小的突破,机器人产业发展也渐显崛起腾飞之势
Cadence Incisive技术提升FPGA/ASIC设计效率
轮廓仪和三坐标测量机的区别
普渡机器人“贝拉”斩获日本G-Mark设计大奖
无线灌溉的优势是什么
全球手机处理器架构进化论:从ARM9到A15
华为一向不单独卖芯片,车机领域也可能如此
触控一体机属于什么设备
大师教你如何制作一个简单的16位CPU
高血压病网络平台,远程医疗新体验
谷歌与高通联手 华为能否顺利闯出重围
彭松深入定义了C.A.F模型 构建联接竞争力创造新增长
2021年全球数据中心市场将增长7.5305亿美元
贸泽电子技术论坛-电源技术实战研讨会在武汉召开
超宽带天线的相关技术理论方法
发挥“风向标”作用!机智云工业物联网平台获“四化”重点赋能平台授牌
减速电机品牌排行榜
码垛机器人保养方式有几种 帕斯科山东机器人科技有限公司
智能传感器是什么 汽车电子传感器中的关键技术
机器人领域的10项前沿技术