处理器结构与原理.pptxVIP

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
处理器结构与原理

1 2.1.1 基本概念 1. 流水线 把一条指令的操作分成多个更小的步骤,每个步骤的操作由专门的电路完成。 利用各电路间可并行执行的特点,让各个步骤的执行在时间上重叠起来。 2.1 Pentium处理器 2 2. CISC与RISC技术 复杂指令集计算机(CISC) :指令格式比较复杂,通常采用不等长指令设计,指令的寻址方式丰富,绝大多数指令的执行需要多个时钟周期。 缺点: 随着计算机结构的改进,指令的功能和指令条数增加,指令系统变得异常庞大。 复杂的指令格式和众多的寻址方式使得组合逻辑电路设计更为复杂,采用微程序又会降低执行速度。 复杂不规整的指令会降低流水线的性能 随着指令条数的增加,完成同一任务的指令组合变多,编译系统在最后优化的时候分析就变得更加困难 3 简单指令集计算机(RISC):通过简化指令,使得计算机的结构变得简单、合理,从而提高CPU的执行速度。 优化指令系统,只选用使用频率高的指令,减少指令条数。 采用简单的指令格式和寻址方式,指令的长度固定,大多数指令能在一个时钟周期内完成。 除了Load/Store指令能访问存储器外外,其他任何指令的操作数或者为立即数或者存放在寄存器中,因此,进行的是寄存器与寄存器之间从操作。通常RISC处理器设计了大量的寄存器临时存放数据。 由于计算机结构简单,所以主要采用硬布线逻辑,较少使用或者不用微程序控制。 4 3. 高速缓冲存储器(Cache) 主机 主存 高速缓冲存储器 Cache的设立依据是程序访问的局部性原理 : for(int i; i100; i++) { a[i]=i*i; } 5 2.1.2 Pentium处理器的特性 80x86系列微处理器兼容 有64位数据总线、 32位地址总线,寻址空间4GB。 RISC型超标量结构 - 两个5级整数指令流水线,一个8级浮点流水线。 具有超级流水线技术的高性能浮点运算器。 数据-代码分离式高速缓存,符合MESI协议。 增强的错误检测和报告功能。 利用片上分支目标缓冲器提高分支指令预测准确性。 常用的指令不采用微程序设计,而改用硬件实现。 支持64位外部数据总线突发传输方式 通过APIC总线支持多处理器系统 6 ① ② ③ ④ ⑤ ①=指令预取 ②=首次译码 ③=二次译码 ④=指令执行 ⑤=写回R 2.1.3 Pentium处理器的内部结构与工作原理 7 指令配对规则 配对的指令必须是简单指令 两条指令之间不可存在“写后读”或“写后写”这样的寄存器相关性 一条指令不能同时既包含位移量又包含立即数 带前缀(JCC指令的OF除外)的指令只能出现在U流水中 浮点运算指令不能和任何指令配对(FCXH除外) MOV AX, 200 MOV CX, AX MOV AX, 200 MOV AX, 412 8 2.2 P6微结构的处理器 2.2.1 P6微结构概述 采用12级3流水超标量结构 多路分支预测 -预测分支未来的方向,为处理器预 先译码分支之后的指令提供依据 动态数据流分析 - 处理器分析几条指令的数据相关性和资源可用性 - 以优化的执行顺序高效地乱序执行这些指令 推测执行 - 在假设分支走向基础上,执行其中一路指令流 双独立总线结构 - 后端总线连接到L2 Cache上 - 前端总线FSB主要负责主存储器的信息传送操作 9 关于乱序执行技术 为了提高指令流的执行效率,乱序执行核心监视很多条指令,然后在不损失数据完整性的前提下,采用能充分发挥多个处理部件并行工作的指令顺序来执行。这个指令顺序可能和原始程序的不一样。 1)A=B+C 2)P=A*2 3)Q=D-E 1)和3)可配对同时执行 10 2.2.2 Pentium III处理器内部结构及工作原理 11 2.3 NetBurst微结构的处理器 2.3.1 NetBurst微结构概述 1. 超级流水线技术 衡量CPU的性能指标是CPU完成应用程序所需的总时间。其计算公式如下: CPU性能=CPU的主频×IPC IPC是每时钟执行的指令条数。 要提高CPU性能,可采用提高CPU主频和提高IPC。 要提高主频→减少每个流水级的执行周期→要减小每个流水级的任务量→将任务再分解→增加流水线深度 12 2.快速执行引擎 NetBurst微结构中配置了一种时钟缓冲器电路,可以使该结构下2个执行简单指令的ALU和2个存储地址AGU运行在两倍的CPU核心频率下 3.高级动态执行 一个高达126条指令的超大指令窗口,避免了处理器为了等待配对指令而出现暂时的停顿,也减少了因Cache没命中,到主存中获取数据而产生等待的次数。 一个4KB的分支目标缓冲器BTB记录更多的过去分支的历

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档