处理器结构与原理.pptxVIP

下载本文档

4
0
约1.34万字
约 68页
2018-06-28 发布于上海
举报
版权申诉

处理器结构与原理.pptx

1、本文档共68页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

处理器结构与原理

1 2.1.1 基本概念 1. 流水线把一条指令的操作分成多个更小的步骤，每个步骤的操作由专门的电路完成。利用各电路间可并行执行的特点，让各个步骤的执行在时间上重叠起来。 2.1 Pentium处理器 2 2. CISC与RISC技术复杂指令集计算机（CISC）：指令格式比较复杂，通常采用不等长指令设计，指令的寻址方式丰富，绝大多数指令的执行需要多个时钟周期。缺点：随着计算机结构的改进，指令的功能和指令条数增加，指令系统变得异常庞大。复杂的指令格式和众多的寻址方式使得组合逻辑电路设计更为复杂，采用微程序又会降低执行速度。复杂不规整的指令会降低流水线的性能随着指令条数的增加，完成同一任务的指令组合变多，编译系统在最后优化的时候分析就变得更加困难 3 简单指令集计算机（RISC）：通过简化指令，使得计算机的结构变得简单、合理，从而提高CPU的执行速度。优化指令系统，只选用使用频率高的指令，减少指令条数。采用简单的指令格式和寻址方式，指令的长度固定，大多数指令能在一个时钟周期内完成。除了Load/Store指令能访问存储器外外，其他任何指令的操作数或者为立即数或者存放在寄存器中，因此，进行的是寄存器与寄存器之间从操作。通常RISC处理器设计了大量的寄存器临时存放数据。由于计算机结构简单，所以主要采用硬布线逻辑，较少使用或者不用微程序控制。 4 3. 高速缓冲存储器（Cache）主机主存高速缓冲存储器 Cache的设立依据是程序访问的局部性原理： for(int i; i100; i++) { a[i]=i*i; } 5 2.1.2 Pentium处理器的特性 80x86系列微处理器兼容有64位数据总线、 32位地址总线，寻址空间4GB。 RISC型超标量结构 - 两个5级整数指令流水线，一个8级浮点流水线。具有超级流水线技术的高性能浮点运算器。数据-代码分离式高速缓存，符合MESI协议。增强的错误检测和报告功能。利用片上分支目标缓冲器提高分支指令预测准确性。常用的指令不采用微程序设计，而改用硬件实现。支持64位外部数据总线突发传输方式通过APIC总线支持多处理器系统 6 ① ② ③ ④ ⑤ ①=指令预取 ②=首次译码 ③=二次译码 ④=指令执行 ⑤=写回R 2.1.3 Pentium处理器的内部结构与工作原理 7 指令配对规则配对的指令必须是简单指令两条指令之间不可存在“写后读”或“写后写”这样的寄存器相关性一条指令不能同时既包含位移量又包含立即数带前缀（JCC指令的OF除外）的指令只能出现在U流水中浮点运算指令不能和任何指令配对（FCXH除外） MOV AX, 200 MOV CX, AX MOV AX, 200 MOV AX, 412 8 2.2 P6微结构的处理器 2.2.1 P6微结构概述采用12级3流水超标量结构多路分支预测-预测分支未来的方向，为处理器预先译码分支之后的指令提供依据动态数据流分析 - 处理器分析几条指令的数据相关性和资源可用性- 以优化的执行顺序高效地乱序执行这些指令推测执行 - 在假设分支走向基础上，执行其中一路指令流双独立总线结构- 后端总线连接到L2 Cache上- 前端总线FSB主要负责主存储器的信息传送操作 9 关于乱序执行技术为了提高指令流的执行效率，乱序执行核心监视很多条指令，然后在不损失数据完整性的前提下，采用能充分发挥多个处理部件并行工作的指令顺序来执行。这个指令顺序可能和原始程序的不一样。 1）A=B+C 2）P=A*2 3）Q=D-E 1）和3）可配对同时执行 10 2.2.2 Pentium III处理器内部结构及工作原理 11 2.3 NetBurst微结构的处理器 2.3.1 NetBurst微结构概述 1. 超级流水线技术衡量CPU的性能指标是CPU完成应用程序所需的总时间。其计算公式如下： CPU性能=CPU的主频×IPC IPC是每时钟执行的指令条数。要提高CPU性能，可采用提高CPU主频和提高IPC。要提高主频→减少每个流水级的执行周期→要减小每个流水级的任务量→将任务再分解→增加流水线深度 12 2.快速执行引擎 NetBurst微结构中配置了一种时钟缓冲器电路，可以使该结构下2个执行简单指令的ALU和2个存储地址AGU运行在两倍的CPU核心频率下 3.高级动态执行一个高达126条指令的超大指令窗口，避免了处理器为了等待配对指令而出现暂时的停顿，也减少了因Cache没命中，到主存中获取数据而产生等待的次数。一个4KB的分支目标缓冲器BTB记录更多的过去分支的历