45个寄存器、CPU核心技术大揭秘(上)

寄存器这个太多太复杂,不适合写故事,拖了很久,总算是写完了,这篇文章就来详细聊聊x86/x64架构的cpu中那些纷繁复杂的寄存器们。
长文预警,时速较快,请系好安全带~起飞~
自1946年冯·诺伊曼领导下诞生的世界上第一台通用电子计算机eniac至今,计算机技术已经发展了七十多载。
从当初专用于数学计算的庞然大物,到后来大型机服务器时代,从个人微机技术蓬勃发展,到互联网浪潮席卷全球,再到移动互联网、云计算日新月异的当下,计算机变的形态各异,无处不在。
这七十多年中,出现了数不清的编程语言,通过这些编程语言,又开发了无数的应用程序。
可无论什么样的应用程序,什么样的编程语言,最终的程序逻辑都是要交付给cpu去执行实现的(当然这里有些不严谨,除了cpu,还有协处理器、gpu等等)。所以了解和学习cpu的原理都是对计算机基础知识的夯实大有裨益。
在七十多年的漫长历程中,也涌现了不少架构的cpu。
mipspowerpcx86/x64ia64arm······这篇文章就以市场应用最为广泛的x86-x64架构为目标,通过学习了解它内部的100个寄存器功能作用,来串联阐述cpu底层工作原理。
通过这篇文章,你将了解到:
cpu指令执行原理内存寻址技术软件调试技术原理中断与异常处理系统调用cpu多任务技术什么是寄存器?寄存器是cpu内部用来存放数据的一些小型存储区域,用来暂时存放参与运算的数据和运算结果以及一些cpu运行需要的信息。
x86架构cpu走的是复杂指令集(cisc) 路线,提供了丰富的指令来实现强大的功能,与此同时也提供了大量寄存器来辅助功能实现。这篇文章将覆盖下面这些寄存器:
通用寄存器标志寄存器指令寄存器段寄存器控制寄存器调试寄存器描述符寄存器任务寄存器msr寄存器通用寄存器首当其冲的是通用寄存器,这些的寄存器是程序执行代码最最常用,也最最基础的寄存器,程序执行过程中,绝大部分时间都是在操作这些寄存器来实现指令功能。
所谓通用,即这些寄存器cpu没有特殊的用途,交给应用程序“随意”使用。注意,这个随意,我打了引号,对于有些寄存器,cpu有一些潜规则,用的时候要注意。
eax : 通常用来执行加法,函数调用的返回值一般也放在这里面ebx : 数据存取ecx : 通常用来作为计数器,比如for循环edx : 读写i/o端口时,edx用来存放端口号esp : 栈顶指针,指向栈的顶部ebp : 栈底指针,指向栈的底部,通常用ebp+偏移量的形式来定位函数存放在栈中的局部变量esi : 字符串操作时,用于存放数据源的地址edi : 字符串操作时,用于存放目的地址的,和esi两个经常搭配一起使用,执行字符串的复制等操作在x64架构中,上面的通用寄存器都扩展成为64位版本,名字也进行了升级。当然,为了兼容32位模式程序,使用上面的名字仍然是可以访问的,相当于访问64位寄存器的低32位。
rax rbx rcx rdx rsp rbp rsi rdi
除了扩展原来存在的通用寄存器,x64架构还引入了8个新的通用寄存器:
r8-r15
在原来32位时代,函数调用时,那个时候通用寄存器少,参数绝大多数时候是通过线程的栈来进行传递(当然也有使用寄存器传递的,比如著名的c++ this指针使用ecx寄存器传递,不过能用的寄存器毕竟不多)。
进入x64时代,寄存器资源富裕了,参数传递绝大多数都是用寄存器来传了。寄存器传参的好处是速度快,减少了对内存的读写次数。
当然,具体使用栈还是用寄存器传参数,这个不是编程语言决定的,而是编译器在编译生成cpu指令时决定的,如果编译器非要在x64架构cpu上使用线程栈来传参那也不是不行,这个对高级语言是无感知的。
标志寄存器标志寄存器,里面有众多标记位,记录了cpu执行指令过程中的一系列状态,这些标志大都由cpu自动设置和修改:
cf 进位标志pf 奇偶标志zf 零标志sf 符号标志of 补码溢出标志tf 跟踪标志if 中断标志 ······
在x64架构下,原来的eflags寄存器升级为64位的rflags,不过其高32位并没有新增什么功能,保留为将来使用。
指令寄存器eip : 指令寄存器可以说是cpu中最最重要的寄存器了,它指向了下一条要执行的指令所存放的地址,cpu的工作其实就是不断取出它指向的指令,然后执行这条指令,同时指令寄存器继续指向下面一条指令,如此不断重复,这就是cpu工作的基本日常。
而在漏洞攻击中,黑客想尽办法费尽心机都想要修改指令寄存器的地址,从而能够执行恶意代码。
同样的,在x64架构下,32位的eip升级为64位的rip寄存器。
段寄存器段寄存器与cpu的内存寻址技术紧密相关。
早在16位的8086cpu时代,内存资源宝贵,cpu使用分段式内存寻址技术:
16位的寄存器能寻址的范围是64kb,通过引入段的概念,将内存空间划分为不同的区域:分段,通过段基址+段内偏移段方式来寻址。
这样一来,段的基地址保存在哪里呢?8086cpu专门设置了几个段寄存器用来保存段的基地址,这就是段寄存器段的由来。
段寄存器也是16位的。
段寄存器有下面6个,前面4个是早期16位模式就引入了,到了32位时代,又新增了fs和gs两个段寄存器。
cs : 代码段ds : 数据段ss : 栈段es : 扩展段fs : 数据段gs : 数据段段寄存器里面存储的内容与cpu当前工作的内存寻址模式紧密相关。
当cpu处于16位实地址模式下时,段寄存器存储段的基地址,寻址时,将段寄存器内容左移4位(乘以16)得到段基地址+段内偏移得到最终的地址。
当cpu工作于保护模式下,段寄存器存储的内容不再是段基址了,此时的段寄存器中存放的是 段选择子 ,用来指示当前这个段寄存器“指向”的是哪个分段。
注意我这里的指向打了引号,段寄存器中存储的并不是内存段的直接地址,而是段选择子,它的结构如下:
16个bit长度的段寄存器内容划分了三个字段:
prl : 特权请求级,就是我们常说的ring0-ring3四个特权级。ti : 0表示用的是全局描述符表gdt,1表示使用的是局部描述符表ldt。index : 这是一个表格中表项的索引值,这个表格叫 内存描述符表 ,它的每一个表项都描述了一个内存分段。这里提到了两个表,全局描述符表gdt和局部描述符表ldt,关于这两个表的介绍,下面介绍描述符寄存器时再详述,这里只需要知道,这是cpu支持分段式内存管理需要的表格,放在内存中,表格中的每一项都是一个描述符,记录了一个内存分段的信息。
保护模式下的段寄存器和段描述符到最后的内存分段,通过下图的方式联系在一起:
通用寄存器、段寄存器、标志寄存器、指令寄存器,这四组寄存器共同构成了一个基本的指令执行环境,一个线程的上下文也基本上就是这些寄存器,在执行线程切换的时候,就是修改它们的内容。
控制寄存器控制寄存器是cpu中一组相当重要的寄存器,我们知道eflags寄存器记录了当前运行线程的一系列关键信息。
那cpu运行过程中自身的一些关键信息保存在哪里呢?答案是控制寄存器!
32位cpu总共有cr0-cr4共5个控制寄存器,64位增加了cr8。他们各自有不同的功能,但都存储了cpu工作时的重要信息:
cr0 : 存储了cpu控制标记和工作状态cr1 : 保留未使用cr2 : 页错误出现时保存导致出错的地址cr3 : 存储了当前进程的虚拟地址空间的重要信息——页目录地址cr4 : 也存储了cpu工作相关以及当前人任务的一些信息cr8 : 64位新增扩展使用 其中,cr0尤其重要,它包含了太多重要的cpu信息。一些重要的标记位含义如下:
pg: 是否启用内存分页
am: 是否启用内存对齐自动检查
wp: 是否开启内存写保护,若开启,对只读页面尝试写入时将触发异常,这一机制常常被用来实现写时复制功能
pe: 是否开启保护模式
除了cr0,另一个值得关注的寄存器是cr3,它保存了当前进程所使用的虚拟地址空间的页目录地址,可以说是整个虚拟地址翻译中的顶级指挥棒,在进程空间切换的时候,cr3也将同步切换。

胆机产生失真的原因及消除的方法,amplifier distortion
紫外线老化试验箱温度控制原理
弱电设备中隐藏的电磁兼容问题探讨
如何选择液压泵及原则介绍
三星拆除LCD生产线加造OLED屏幕只因需求量太大
45个寄存器、CPU核心技术大揭秘(上)
展现最新科技成果,打造领先行业标杆:三星多款显示器亮相2023进博会
DC/DC 升压模式转换器LT3598
HarmonyOS自定义列表组件封装
施耐德大功率变频器电路分析_施耐德变频维修
兆易创新精彩亮相ICCAD,以存储技术赋能新一代智能可穿戴应用
安防行业大变局!安防技术派的胜利!
智能技术打造农业机器人,助力农业智能化转型
第三届联合国教科文组织创意城市北京峰会开幕
线路板词汇中英文对照表
【工程师开发板使用测评】爱普特 APT32F110 ev board 试用测评连载02
MAX8510/MAX8511/MAX8512超低噪声、低压差(LDO)线性稳压器
谷歌将华为Mate 20 Pro从Android Q名单中悄然移除
八大点浅析电动汽车造型设计
A/D转换器的作用是什么?