计算机组成原理中央处理机研讨.ppt

下载文档 降价啦

5
0
约2.44万字
约 118页
2016-08-07 发布于湖北
举报
版权申诉
保障服务

计算机组成原理中央处理机研讨.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机组成原理中央处理机研讨

(1) I1: 　ADD R1，R2，R3 ；　 (R2)+(R3)→R1 　 I2: 　SUB R4，R1，R5 ；　 (R1)-(R5)→R4 【解】第(1)组指令中，I1指令运算结果应先写入R1，然后在I2指令中读出R1内容。由于I2指令进入流水线，变成I2指令在I1指令写入R1前就读出R1内容，发生RAW相关 (2) I3: 　STO M(x)，R3 ；　(R3)→M(x)，M(x)是存储器单元 I4: 　ADD R3，R4，R5；　(R4)+(R5)→R3 【解】第(2)组指令中，I3指令应先读出R3内容并存入存储单元M(x)，然后在I4指令中将运算结果写入R3。但由于I4指令进入流水线，变成I4指令在I3指令读出R3内容前就写入R3，发生WAR相关 (3) I5: 　MUL R3，R1，R2 ；　　(R1)×(R2)→R3 　 I6:　 ADD R3，R4，R5 ；　　(R4)+(R5)→R3 【解】第(3)组指令中，如果I6指令的加法运算完成时间早于I5指令的乘法运算时间，变成指令I6在指令I5写入R3前就写入R3，导致R3的内容错误，发生WAW相关 3. 控制相关 ——转移指令会引起流水线发生断流解决办法：延迟转移法——由编译程序重排指令序列来实现基本思想是“先执行再转移” 转移预测法——用硬件方法实现设置转移取和顺序取两路指令预取队列器以及目标指令cache，将转移预测提前到取指阶段进行 1. pentium的技术性能超标量流水处理器，工作电压；主频内部主要寄存器宽度；外部数据总线宽度；支持多种类型的总线周期(包括猝发模式) 外部地址总线宽度、物理地址空间、虚拟地址空间；分页模式支持的页面大小(4KB/4MB/2MB) L1cache(指令cache和数据cache)、L2cache；CPU采用U，V两条指令流水线(超标量流水线)，整数指令和浮点指令的发射操作控制器采用硬布线控制和微程序控制相结合——简单指令和微程序实现的指令的处理方法非固定长度的指令格式，9种寻址方式，191条指令；每个时钟周期能执行两条指令；兼具CISC和RlSC的特性具有BTB (转移目标缓冲器)方式的转移预测能力 5.6.4 奔腾 CPU 　 2. 奔腾CPU的结构框图 (1)超标量流水线 ——含U和V两条指令流水线，有各自的ALU、地址生成电路、与数据cache的接口；两个指令预取缓冲器(各32字节) 指令译码器——译码，并完成指令配对检查发射一对指令满足的条件：①都是简单指令②不发生数据相关③都不同时含有立即数和偏移量④只有I1允许带指令前缀配对检查合格与不合格的处理方法对整数指令和浮点数指令的不同处理方法控制ROM——存放微指令代码地址生成器——计算存储器操作数地址，并用TLB 加速转换寄存器堆——8个32位整数寄存器除法 (2)指令cache和数据cache 80486 CPU——8KB cache，指令和数据共用奔腾CPU——分设指令cache和数据cache(各8KB)，使指令预取和数据读写能无冲突地同时完成，且可同时与U，V两条流水线分别交换数据指令cache——只读，以单端口256位向指令预取缓冲器提供超长指令字代码数据cache——可读可写，双端口(各32位)，与U，V两条流水线交换整数数据，或组合后与浮点运算部件交换浮点数据都是2路组相联结构，每行32字节；数据cache可设置成行写回或全写法方式两个cache都使用物理地址，各有一个后援缓冲器TLB，负责将TLB命中的线性地址转换成32位物理地址 (3)浮点运算部件 8段的流水浮点运算器，前4段在U、V流水线中(PF、D1、D2、EX)；后4段在浮点运算部件中完成(X1、X2、WF、ER) 有浮点专用加法器、乘法器和除法器；支持3种格式的浮点数(IEEE754的单、双精度格式、 80位的临时实数) 含8个80位寄存器组成的寄存器堆；内部的数据总线为80位对于常用指令(如LOAD，ADD，MUL等)采用了新的算法，用硬件实现，提高了执行速度 (4)动态转移预测技术 ——为了防止执行转移指令时流水线断流设置转移目标缓冲器BTB ——小容量cache，用来记录导致程序转移的指令及其转移目标地址；以后遇到该转移指令时，BTB依据前后转移发生的历史预测本次是转移取还是顺序取；若预测为转移取，则将记录的转移目标地址送出设置两个指令预取缓冲器(每个32字节) 通常使用其中一个；若指令译码段译出一条转移指令则立即检索BTB，根据预测结果决定是否冻结该缓冲器，而启用另一个 ——保证流水线的指令预取步骤不会空置；并且预测转移取错误时，正确路径的指令已在另一个缓冲器中，使流水线的性能损失减至

您可能关注的文档

文档评论（0）

bbnm58850 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

计算机组成原理中央处理机研讨.ppt