第 7 章流水线结构RISC CPU设计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 7 章流水线结构RISC CPU设计

现代计算机组成原理 潘 明 潘 松 编著 第 7 章 流水线结构RISC CPU设计 7.3流水线的性能评价 7.3.1 流水线的性能指标 1.流水线的主要性能指标 (2)加速比 (7-3) (7-4) (3)使用效率 7.3流水线的性能评价 7.3.1 流水线的性能指标 2.CPU性能公式 (7-5) (7-6) (7-7) (7-8) (7-9) 7.3流水线的性能评价 7.3.2 应用举例 1.一般流水线的性能分析 7-13 用4段加法器求8个数和的流水线时空图 流水线的吞吐率TP为 流水线的加速比S为 7.3流水线的性能评价 7.3.2 应用举例 2.流水线延时与开销对流水线性能的影响 单条指令执行时间 = CC ? 平均CPI = 10 ?(60% ?4 + 40% ?5)= 44ns 平均指令执行时间:CCpipeline = 11ns 于是得到:Speedup = 44 /11 = 4 欲求若使用流水线,执行速度提高了几倍。计算方法是: 欲求执行速度提高了几倍?计算方法如下: 平均指令执行时间 = 10+8+10+10+7 = 45ns, 而流水线时平均指令执行时间 = 11ns; 于是得到:Speedup = 45/11 = 4.1 7.3流水线的性能评价 7.3.2 应用举例 3.流水线障碍(流水线竞争)对流水线性能的影响 (7-10) CPI pipeline = CPI ideal + 流水线stall周期 = 1 +流水线stall周期 (7-11) 7.3流水线的性能评价 7.3.2 应用举例 3.流水线障碍(流水线竞争)对流水线性能的影响 (7-12) (7-13) 7.3流水线的性能评价 7.3.2 应用举例 4.结构竞争对流水线性能的影响 图7-14 7-13 结构竞争示意图 7.3流水线的性能评价 7.3.2 应用举例 4.结构竞争对流水线性能的影响 图7-15 7-14 结构竞争流水线状态图 7.3流水线的性能评价 7.3.2 应用举例 5.控制竞争对流水线性能的影响 图7-15 7-14 结构竞争流水线状态图 7.3流水线的性能评价 7.3.2 应用举例 5.控制竞争对流水线性能的影响 图7-17 预测成功无停顿 7.3流水线的性能评价 7.3.2 应用举例 5.控制竞争对流水线性能的影响 图7-18 预测失败停顿一个周期 7.3流水线的性能评价 7.3.3 Amdahl定律 Amdahl定律还可以表为如下形式 习 题 7-1.判断以下三组指令中各存在哪种类型的数据相关? (1)I1 LAD R1,A ;M(A)→ R1,M(A)是存储器单元 I2 ADD R2,R1 ;(R2)+(R1)→ R2 (2)I3 ADD R3,R4 ;(R3)+(R4)→ R3 I4 MUL R4,R5 ;(R4)+(R5)→ R4 (3)I5 LAD R6,B ;M(B)→ R6,M(B)是存储单元 I6 MUL R6,R7 ;(R6)× (R7)→ R6 7-2.指令流水线有取指(IF)、译码(ID)、执行(EX)、访存(MEM)、写回寄存器堆(WB)五个过程段,现共有2条指令连续输入此流水线。画出流水处理的时空图,假设时钟周期为100ns。 习 题 7-3.假设有一个计算机系统分为四级,每一级指令都比它下面一级指令在功能上强M倍。即一条r+1级指令能够完成M条r指令的工作,且一条r+1指令需要N条r级指令解释。对于一段在第一级执行时间为K的程序,在第二、第三、第四级上的一段等效程序需要执行多少时间? 7-4.对于一台400MHz计算机执行标淮测试程序,此程序中的指令类型,执行数量和平均时钟周期数如下表,求该计算机的有效CPI、MIPS和程序执行时间。 指令类型 指令执行数量 平均时钟周期数 整数 45 000 1 数据传送 75 000 2 浮点 8 000 4 分支 1 500 2 习 题 7-5.计算机系统中有三个部件可以改进,这三个部件的部件加速比如下: 部件加速比1=30 ; 部件加速比2=20 ;部件加速比3=10 (1)如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10%? (2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? (3)如果相对某个测试程序,

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档