计算机组成原理 中央处理机研讨.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机组成原理 中央处理机研讨

(1) I1:  ADD R1,R2,R3 ;  (R2)+(R3)→R1   I2:  SUB R4,R1,R5 ;   (R1)-(R5)→R4 【解】 第(1)组指令中,I1指令运算结果应先写入R1,然后在I2指令中读出R1内容。由于I2指令进入流水线,变成I2指令在I1指令写入R1前就读出R1内容,发生RAW相关 (2) I3:  STO M(x),R3 ;  (R3)→M(x),M(x)是存储器单元 I4:  ADD R3,R4,R5; (R4)+(R5)→R3 【解】 第(2)组指令中,I3指令应先读出R3内容并存入存储单元M(x),然后在I4指令中将运算结果写入R3。但由于I4指令进入流水线,变成I4指令在I3指令读出R3内容前就写入R3,发生WAR相关 (3) I5:  MUL R3,R1,R2 ;  (R1)×(R2)→R3   I6:  ADD R3,R4,R5 ;  (R4)+(R5)→R3 【解】 第(3)组指令中,如果I6指令的加法运算完成时间早于I5指令的乘法运算时间,变成指令I6在指令I5写入R3前就写入R3,导致R3的内容错误,发生WAW相关 3. 控制相关 ——转移指令会引起流水线发生断流 解决办法: 延迟转移法——由编译程序重排指令序列来实现 基本思想是“先执行再转移” 转移预测法——用硬件方法实现 设置转移取和顺序取两路指令预取队列器以及目标指令cache,将转移预测提前到取指阶段进行 1. pentium的技术性能 超标量流水处理器,工作电压;主频 内部主要寄存器宽度;外部数据总线宽度;支持多种类型的总线周期(包括猝发模式) 外部地址总线宽度、物理地址空间、虚拟地址空间;分页模式支持的页面大小(4KB/4MB/2MB) L1cache(指令cache和数据cache)、L2cache;CPU采用U,V两条指令流水线(超标量流水线),整数指令和浮点指令的发射 操作控制器采用硬布线控制和微程序控制相结合——简单指令和微程序实现的指令的处理方法 非固定长度的指令格式,9种寻址方式,191条指令;每个时钟周期能执行两条指令;兼具CISC和RlSC的特性 具有BTB (转移目标缓冲器)方式的转移预测能力 5.6.4 奔腾 CPU   2. 奔腾CPU的结构框图 (1)超标量流水线 ——含U和V两条指令流水线,有各自的ALU、地址生成电路、与数据cache的接口;两个指令预取缓冲器(各32字节) 指令译码器——译码,并完成指令配对检查 发射一对指令满足的条件:①都是简单指令②不发生数据相关③都不同时含有立即数和偏移量④只有I1允许带指令前缀 配对检查合格与不合格的处理方法 对整数指令和浮点数指令的不同处理方法 控制ROM——存放微指令代码 地址生成器——计算存储器操作数地址,并用TLB 加速转换 寄存器堆——8个32位整数寄存器 除法 (2)指令cache和数据cache 80486 CPU——8KB cache,指令和数据共用 奔腾CPU——分设指令cache和数据cache(各8KB),使指令预取和数据读写能无冲突地同时完成,且可同时与U,V两条流水线分别交换数据 指令cache——只读,以单端口256位向指令预取缓冲器提供超长指令字代码 数据cache——可读可写,双端口(各32位),与U,V两条流水线交换整数数据,或组合后与浮点运算部件交换浮点数据 都是2路组相联结构,每行32字节;数据cache可设置成行写回或全写法方式 两个cache都使用物理地址,各有一个后援缓冲器TLB,负责将TLB命中的线性地址转换成32位物理地址 (3)浮点运算部件 8段的流水浮点运算器,前4段在U、V流水线中(PF、D1、D2、EX);后4段在浮点运算部件中完成(X1、X2、WF、ER) 有浮点专用加法器、乘法器和除法器;支持3种格式的浮点数(IEEE754的单、双精度格式、 80位的临时实数) 含8个80位寄存器组成的寄存器堆;内部的数据总线为80位 对于常用指令(如LOAD,ADD,MUL等)采用了新的算法,用硬件实现,提高了执行速度 (4)动态转移预测技术 ——为了防止执行转移指令时流水线断流 设置转移目标缓冲器BTB ——小容量cache,用来记录导致程序转移的指令及其转移目标地址;以后遇到该转移指令时,BTB依据前后转移发生的历史预测本次是转移取还是顺序取;若预测为转移取,则将记录的转移目标地址送出 设置两个指令预取缓冲器(每个32字节) 通常使用其中一个;若指令译码段译出一条转移指令则立即检索BTB,根据预测结果决定是否冻结该缓冲器,而启用另一个 ——保证流水线的指令预取步骤不会空置;并且预测转移取错误时,正确路径的指令已在另一个缓冲器中,使流水线的性能损失减至

文档评论(0)

bbnm58850 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档