cpu的相关技术参数及其处理技术

cpu是central processing unit--中央处理器的缩写,它由运算器和控制器组成,cpu的内部结构可分为控制单元,逻辑单元和存储单元三大部分。cpu的工作原理就象一个工厂对产品的加工过程:进入工厂的原料(指令),经过物资分配部门(控制单元)的调度分配,被送往生产线(逻辑运算单元),生产出成品(处理后的数据)后,再存储在仓库(存储器)中,最后交由应用程序使用。
中央处理器简称cpu(central processing unit),它是计算机系统的核心,主要包括运算器和控制器两个部件。如果把计算机比作一个人,那么cpu就是心脏,其重要作用由此可见一斑。cpu的内部结构可以分为控制单元、逻辑单元和存储单元三大部分,三个部分相互协调,便可以进行分析,判断、运算并控制计算机各部分协调工作。
计算机发生的所有动作都是受cpu控制的。其中运算器主要完成各种算术运算(如加、减、乘、除)和逻辑运算( 如逻辑加、逻辑乘和非运算);
而控制器不具有运算功能,它只是读取各种指令,并对指令进行分析,作出相应的控制。通常,在cpu中还有若干个寄存器,它们可直接参与运算并存放运算的中间结果。
我们常说的cpu都是x86系列及兼容cpu ,所谓x86指令集是美国intel公司为其第一块16位cpu(i8086)专门开发的,美国ibm公司1981年推出的世界第一台pc机中的cpu— i8088(i8086简化版)使用的也是x86指令,同时电脑中为提高浮点数据处理能力而增加的x87芯片系列数学协处理器则另外使用x87指令,以后就将x86指令集和x87指令集统称为x86指令集。虽然随着cpu技术的不断发展,intel陆续研制出更新型的i80386、i80486直到今天的pentium ⅲ系列,但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,intel公司所生产的所有cpu仍然继续使用x86指令集。
另外除intel 公司之外,amd和cyrix等厂家也相继生产出能使用x86指令集的cpu,由于这些cpu能运行所有的为inte lcpu所开发的各种软件,所以电脑业内人士就将这些cpu列为intel的cpu兼容产品。由于intel x8 6系列及其兼容cpu都使用x86指令集,就形成了今天庞大的x86系列及兼容cpu阵容。
cpu的主要相关技术参数
1.主频
主频也叫时钟频率,单位是mhz,用来表示cpu的运算速度。cpu的主频=外频×倍频系数。很多人以为认为cpu的主频指的是cpu运行的速度,实际上这个认识是很片面的。cpu的主频表示在cpu内数字脉冲信号震荡的速度,与cpu实际的运算能力是没有直接关系的。当然,主频和实际的运算速度是有关的,但是目前还没有一个确定的公式能够实现两者之间的数值关系,而且cpu的运算速度还要看cpu的流水线的各方面的性能指标。由于主频并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的cpu实际运算速度较低的现象。因此主频仅仅是cpu性能表现的一个方面,而不代表cpu的整体性能。 ?? ??
2.外频
外频是cpu的基准频率,单位也是mhz。外频是cpu与主板之间同步运行的速度,而且目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为cpu的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(fsb)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。 so?鰀 b?
3.前端总线(fsb)频率
前端总线(fsb)频率(即总线频率)是直接影响cpu与内存直接数据交换速度。由于数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据带宽)/8。外频与前端总线(fsb)频率的区别:前端总线的速度指的是数据传输的速度,外频是cpu与主板之间同步运行的速度。也就是说,100mhz外频特指数字脉冲信号在每秒钟震荡一千万次;而100mhz前端总线指的是每秒钟cpu可接受的数据传输量是100mhz×64bit÷8byte/bit=800mb/s。
4.倍频系数
倍频系数是指cpu主频与外频之间的相对比例关系。在相同的外频下,倍频越高cpu的频率也越高。但实际上,在相同外频的前提下,高倍频的cpu本身意义并不大。这是因为cpu与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的cpu就会出现明显的“瓶颈”效应——cpu从系统中得到数据的极限速度不能够满足cpu运算的速度。
5.缓存
缓存是指可以进行高速数据交换的存储器,它先于内存与cpu交换数据,因此速度很快。l1 cache(一级缓存)是cpu第一层高速缓存。内置的l1高速缓存的容量和结构对cpu的性能影响较大,不过高速缓冲存储器均由静态ram组成,结构较复杂,在cpu管芯面积不能太大的情况下,l1级高速缓存的容量不可能做得太大。一般l1缓存的容量通常在32~256kb。
l2 cache(二级缓存)是cpu的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频详图,而外部的二级缓存则只有主频的一半。l2高速缓存容量也会影响cpu的性能,原则是越大越好,现在家庭用cpu容量最大的是512kb,而服务器和工作站上用cpu的l2高速缓存更高达1mb-3mb。
6.cpu扩展指令集
cpu扩展指令集指的是cpu增加的多媒体或者是3d处理指令,这些扩展指令可以提高cpu处理多媒体和3d图形的能力。著名的有mmx(多媒体扩展指令)、sse(因特网数据流单指令扩展)和3dnow!指令集。
7.cpu内核和i/o工作电压
从586cpu开始,cpu的工作电压分为内核电压和i/o电压两种。其中内核电压的大小是根据cpu的生产工艺而定,一般制作工艺越小,内核工作电压越低;i/o电压一般都在1.6~3v。低电压能解决耗电过大和发热过高的问题。
8.制造工艺
指在硅材料上生产cpu时内部各元器材的连接线宽度,一般用微米表示。微米值越小制作工艺越先进,cpu可以达到的频率越高,集成的晶体管就可以更多。目前intel的p4和amd的xp都已经达到了0.09微米的制造工艺
cpu处理技术
在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在cpu中由5-6个不同功能的电路单元组成一条指令处理流水线,然后将一条x86指令分成5-6步后再由这些电路单元分别执行,这样就能实现在一个cpu时钟周期完成一条指令,因此提高cpu的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以空间换取时间。例如pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的cpu。但是流水线过长也带来了一定副作用,很可能会出现主频较高的cpu实际运算速度较低的现象,intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4g以上,但其运算性能却远远比不上amd 1.2g的速龙甚至奔腾iii-s。
cpu封装是采用特定的材料将cpu芯片或cpu模块固化在其中以防损坏的保护措施,一般必须在封装后cpu才能交付用户使用。cpu的封装方式取决于cpu安装形式和器件集成设计,从大的分类来看通常采用socket插座进行安装的cpu使用pga(栅格阵列)方式封装,而采用slot x槽安装的cpu则全部采用sec(单边接插盒)的形式封装。还有plga(plastic land grid array)、olga(organic land grid array)等封装技术。由于市场竞争日益激烈,cpu封装技术的发展方向以节约成本为主。
多线程
同时多线程simultaneous multithreading,简称smt。smt可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或cache未命中带来的访问内存延时。当没有多个线程可用时,smt处理器几乎和传统的宽发射超标量处理器一样。smt最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。intel从3.06ghz pentium 4开始,部分处理器将支持smt技术。
多核心
多核心,也指单芯片多处理器(chip multiprocessors,简称cmp)。cmp是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的smp(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。这种依靠多个cpu同时并行地运行程序是实现超高速计算的一个重要方向,称为并行处理。与cmp比较,smp处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于cmp结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。ibm 的power 4芯片和sun的majc5200芯片都采用了cmp结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。但这并不是说明,核心越多,性能越高,比如说16核的cpu就没有8核的cpu运算速度快,因为核心太多,而不能合理进行分配,所以导致运算速度减慢。在买电脑时请酌情选择。2005年下半年,intel和amd的新型处理器也将融入cmp结构。新安腾处理器开发代码为montecito,采用双核心设计,拥有最少18mb片内缓存,采取90nm工艺制造。它的每个单独的核心都拥有独立的l1,l2和l3 cache,包含大约10亿支晶体管。
smp
smp(symmetric multi-processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多cpu),各cpu之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是所说的二路,这是在对称处理器系统中最常见的一种(至强mp可以支持到四路,amd opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,smp结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像unix服务器可支持最多256个cpu的系统。
构建一套smp系统的必要条件是:支持smp的硬件包括主板和cpu;支持smp的系统平台,再就是支持smp的应用软件。为了能够使得smp系统发挥高效的性能,操作系统必须支持smp系统,如winnt、linux、以及unix等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的cpu完成不同的任务;多线程是指操作系统能够使得不同的cpu并行的完成同一个任务。
要组建smp系统,对所选的cpu有很高的要求,首先、cpu内部必须内置apic(advanced programmable interrupt controllers)单元。intel 多处理规范的核心就是高级可编程中断控制器(advanced programmable interrupt controllers–apics)的使用;再次,相同的产品型号,同样类型的cpu核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的cpu作为双处理器运行的时候,有可能会发生一颗cpu负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。
numa技术
numa即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的cpu或是smp系统。在numa中,cache 的一致性有多种解决方案,一般采用硬件技术实现对cache的一致性维护,通常需要操作系统针对numa访存不一致的特性(本地内存和远端内存访存延迟和带宽的不同)进行特殊优化以提高效率,或采用特殊软件编程方法提高效率。numa系统的例子。这里有3个smp模块用高速专用网络联起来,组成一个节点,每个节点可以有12个cpu。像sequent的系统最多可以达到64个cpu甚至256个cpu。显然,这是在smp的基础上,再用numa的技术加以扩展,是这两种技术的结合。
乱序执行
乱序执行(out-of-orderexecution),是指cpu允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使cpu内部电路满负荷运转并相应提高了cpu的运行程序的速度。
分枝技术
(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。
控制器
许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的cpu特性,也会受内存延迟的限制。这样cpu必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自cpu cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而cpu速度则达到了4ghz以上,一次单独的内存请求可能会浪费200-300次cpu循环。即使在缓存命中率(cache hit rate)达到99.9%的情况下,cpu也可能会花50%的时间来等待内存请求的结束-比如因为内存延迟的缘故。
在处理器内部整合内存控制器,使得北桥芯片将变得不那么重要,改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性制造工艺:intel的i5可以达到28纳米,在将来的cpu制造工艺可以达到22纳米。

人脸识别的原理说明
驱动PCB有什么间距的要求
新款MacBook Pro预计11月17日登陆第三方商店 仅有少量可发货
泡沫成型机PLC监控运维系统解决方案
如何搭建云计算平台_搭建云计算平台步骤
cpu的相关技术参数及其处理技术
C#模式匹配入门指南
魅族pro7什么时候上市?魅族pro7最新消息:魅族PRO7确定双屏,魅蓝新A系列上市,居然没开演唱会
智能家居不够机智 人工智能放荡管家
STM8CubeMX和STM32CubeMX功能一样吗?
天津众推科技研发出智能电话机器人,未来电销会被机器人代替吗
详解Modbus协议的RTU帧和ASCII帧(2)
自恢复保险丝电压选择_自恢复保险丝优缺点
家庭影院套装的收音机功能
工业4G路由器的分类有哪几种?
一键搞定,火车站媒体信息发布系统解决方案
TCL空调发布征集活动,TCL柔风空调slogan由您说了算
IBM watsonx荣获2023年"世界互联网大会领先科技奖"
米家互联网空调一级能效版发布 最大的特点就是智能控制
基于飞轮储能阵列的新型DVR串联型电压恢复器