- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
处理器结构与原理
1
2.1.1 基本概念
1. 流水线
把一条指令的操作分成多个更小的步骤,每个步骤的操作由专门的电路完成。
利用各电路间可并行执行的特点,让各个步骤的执行在时间上重叠起来。
2.1 Pentium处理器
2
2. CISC与RISC技术
复杂指令集计算机(CISC) :指令格式比较复杂,通常采用不等长指令设计,指令的寻址方式丰富,绝大多数指令的执行需要多个时钟周期。
缺点:
随着计算机结构的改进,指令的功能和指令条数增加,指令系统变得异常庞大。
复杂的指令格式和众多的寻址方式使得组合逻辑电路设计更为复杂,采用微程序又会降低执行速度。
复杂不规整的指令会降低流水线的性能
随着指令条数的增加,完成同一任务的指令组合变多,编译系统在最后优化的时候分析就变得更加困难
3
简单指令集计算机(RISC):通过简化指令,使得计算机的结构变得简单、合理,从而提高CPU的执行速度。
优化指令系统,只选用使用频率高的指令,减少指令条数。
采用简单的指令格式和寻址方式,指令的长度固定,大多数指令能在一个时钟周期内完成。
除了Load/Store指令能访问存储器外外,其他任何指令的操作数或者为立即数或者存放在寄存器中,因此,进行的是寄存器与寄存器之间从操作。通常RISC处理器设计了大量的寄存器临时存放数据。
由于计算机结构简单,所以主要采用硬布线逻辑,较少使用或者不用微程序控制。
4
3. 高速缓冲存储器(Cache)
主机
主存
高速缓冲存储器
Cache的设立依据是程序访问的局部性原理 :
for(int i; i100; i++)
{
a[i]=i*i;
}
5
2.1.2 Pentium处理器的特性
80x86系列微处理器兼容
有64位数据总线、 32位地址总线,寻址空间4GB。
RISC型超标量结构 - 两个5级整数指令流水线,一个8级浮点流水线。
具有超级流水线技术的高性能浮点运算器。
数据-代码分离式高速缓存,符合MESI协议。
增强的错误检测和报告功能。
利用片上分支目标缓冲器提高分支指令预测准确性。
常用的指令不采用微程序设计,而改用硬件实现。
支持64位外部数据总线突发传输方式
通过APIC总线支持多处理器系统
6
①
②
③
④
⑤
①=指令预取
②=首次译码
③=二次译码
④=指令执行
⑤=写回R
2.1.3 Pentium处理器的内部结构与工作原理
7
指令配对规则
配对的指令必须是简单指令
两条指令之间不可存在“写后读”或“写后写”这样的寄存器相关性
一条指令不能同时既包含位移量又包含立即数
带前缀(JCC指令的OF除外)的指令只能出现在U流水中
浮点运算指令不能和任何指令配对(FCXH除外)
MOV AX, 200
MOV CX, AX
MOV AX, 200
MOV AX, 412
8
2.2 P6微结构的处理器
2.2.1 P6微结构概述
采用12级3流水超标量结构
多路分支预测-预测分支未来的方向,为处理器预 先译码分支之后的指令提供依据
动态数据流分析 - 处理器分析几条指令的数据相关性和资源可用性- 以优化的执行顺序高效地乱序执行这些指令
推测执行 - 在假设分支走向基础上,执行其中一路指令流
双独立总线结构- 后端总线连接到L2 Cache上- 前端总线FSB主要负责主存储器的信息传送操作
9
关于乱序执行技术
为了提高指令流的执行效率,乱序执行核心监视很多条指令,然后在不损失数据完整性的前提下,采用能充分发挥多个处理部件并行工作的指令顺序来执行。这个指令顺序可能和原始程序的不一样。
1)A=B+C
2)P=A*2
3)Q=D-E
1)和3)可配对同时执行
10
2.2.2 Pentium III处理器内部结构及工作原理
11
2.3 NetBurst微结构的处理器
2.3.1 NetBurst微结构概述
1. 超级流水线技术
衡量CPU的性能指标是CPU完成应用程序所需的总时间。其计算公式如下:
CPU性能=CPU的主频×IPC
IPC是每时钟执行的指令条数。
要提高CPU性能,可采用提高CPU主频和提高IPC。
要提高主频→减少每个流水级的执行周期→要减小每个流水级的任务量→将任务再分解→增加流水线深度
12
2.快速执行引擎
NetBurst微结构中配置了一种时钟缓冲器电路,可以使该结构下2个执行简单指令的ALU和2个存储地址AGU运行在两倍的CPU核心频率下
3.高级动态执行
一个高达126条指令的超大指令窗口,避免了处理器为了等待配对指令而出现暂时的停顿,也减少了因Cache没命中,到主存中获取数据而产生等待的次数。
一个4KB的分支目标缓冲器BTB记录更多的过去分支的历
文档评论(0)