计算机组成与系统结构部分答案 第7章习题答案.docxVIP

计算机组成与系统结构部分答案 第7章习题答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7.2 7.5 7.7 最大吞吐率=1/max{τ}=1/(120ns)= 8.33MFLOPS CPI2=1+20%*0.5=1.1 吞吐率TP=fclk/CPI 故TP1/TP2=CPI2/CPI1=1.1 快 10% 1000 条指令的执行时间为(10+5+5+10+5+(1000-1)*10)ns=10025ns 故吞吐率为 1000/10025ns=99.8MIPS 非流水时,1000 条指令执行时间为(10+5+5+10+5)*1000=35000ns故加速比=35000/10025=3.49 将第 1 级和第 4 级流水段重复设置或细分,从而将两段的处理时间降为 5ns,此时最大吞吐率=1/(5ns)=200MIPS 7.8 一旦确定 I3 分支,则认为编译器可提前预测到分支线路 I3→I8→I9→I6,故 I9→I6 的 跳转不造成断流。整个流水线只有 I3→I8,I6→I2 会产生断流。 S5 1 2 3 4 5 6 2 3 4 5 6 2 3 4 5 6 S4 1 2 3 4 5 6 7 2 3 4 5 6 7 2 3 4 5 6 7 S3 1 2 3 4 5 6 7 2 3 4 5 6 7 2 3 4 5 6 7 S2 1 2 3 4 5 6 7 2 3 4 5 6 7 2 3 4 5 6 7 S1 1 2 3 4 5 6 7 2 3 4 5 6 7 2 3 4 5 6 7 未 分 支 未 分支 未分支 2 3 8 9 6 2 3 8 9 6 7 2 3 4 8 9 6 7 2 3 4 8 9 6 7 2 3 4 5 8 9 6 7 2 3 4 5 8 9 6 7 2 3 4 5 6 8 9 6 7 2 3 4 5 6 8 9 6 7 2 3 4 5 6 7 8 9 6 7 2 3 4 5 6 7 8 9 6 7 分支 分支 结束 指令数为 1+5×10+1=52 无跳转时,从 I2 到 I6 花时间 5+5-1=9 有跳转时,从 I2 到 I3 花时间 2+5-1=6,从 I8、I9 到 I6 花时间 3+5-1=7,共为 6+7=13 故总时间 T=τ(1+(9+13)×5+1)=112τ 或者:每次循环 I6→I2 跳转,需重新充满流水线,需时间(5-1)×9条件分支 I3 跳转,需重新充满流水线,需时间(5-1)×5 总时间 T=τ(52+5-1+(5-1)×9+(5-1)×5)=112τ 吞吐率为 TP=52/(112τ)= 0.464/τ 无流水线时,总时间为 T=5τ×52=260τ 故加速比为 260/112=2.32 若仅考虑有效执行的 52 条指令在流水段上产生的设备运行效率,则 E=TP*τ=46.4% 7.10 非流水机的指令平均执行时间为(4*40%+4*20%+5*40%)*10ns=44ns流水机指令平均执行时间为 11ns,故加速比为 4 7.11 1) 取指 取指 译码 执行MUL 执行ADD 执行MOV 2) MUL 2 2 2 2 ADD 3 3 3 MOV 1 1 译码 1 2 3 取指 1 2 3 7.12 非流水执行时间为T1=100*CPI/fclk=100*4/25M=16us 流水执行时间T2=(100+5-1)/20M=5.2us 故加速比为 16/5.2=3.077 速率为TP1=100/T1=100/16us=6.25MIPS TP2=100/T2=100/5.2us=19.23MIPS 7.13 1: R1=A1+A2 2: R2=A3+A4 3: R3=A5+A6 4:R4=A7+A8 5:R5=A9+A10 6: R6=R1+R2 7: R7=R3+R4 8: R8=R5+R6 9:R9=R7+R8 S5 1 2 3 4 5 6 7 8 9 S4 1 2 3 4 5 6 7 8 9 S3 1 2 3 4 5 6 7 8 9 S2 1 2 3 4 5 6 7 8 9 S1 1 2 3 4 5 6 7 8 9 吞吐率TP=9/(21τ)= 0.429/τ加速比=5*9/21= 2.143 效率E=TP*τ=0.429 7.14 TP=n/(3(n-1)+1+3+1+1) τ =n/(3n+3) τ =100/303 τ = 0.33/ τ , τ =1us , 故 =0.33MIPS 7.15 1 S1 S2 S3 S4 2 S1 S2 S3 S4 3 S1 S2 S3 S4 4 S1 S2 S3 S4 5 S1 S2 S3 S4 6 S1 S2 S3 S4 7 S1 S2 S3 S4 8 S1 S2 S3 S4 9 S1 S2 S3 S4 需要 6 个时钟周期 每个部件执行 3 条指令,3 个周期,故效率为 3/6=0.5 7.16 τ=1/

您可能关注的文档

文档评论(0)

暗伤 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档