- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
习题6.7( GCD测试方法) 在使用GCD测试之前,必须先对这段代码进行“规范化”——修改下标从1开始,而且每次循环后增加1。 For(i=1;i=100;i+=2) a[i]=a[i-1]; 规范化为:For(k=1;k=50;k++) a[2K]=a[2K-1]; 在这个循环中a=2,b=0,c=2,d=-1, 这样GCD(a,c)=2, d-b=-1, 由于前者不能够整除后者; 该循环不存在循环携带的真数据相关。 习题6.8(循环展开) 表6.1本节使用的浮点流水线的延迟 产生结果的指令 使用结果的指令 延迟(cycles) 浮点计算 另一个浮点计算 3 浮点计算 浮点store(S.D) 2 浮点Load(L.D) 浮点计算 1 浮点Load(L.D) 浮点store(S.D) 0 整数运算,分支延迟和load需要一个周期延迟, 如果分支的寄存器在前一条指令计算出,也需要一个周期延迟, 因为整数计算在第3个周期完成,而分支第2个周期就用到 DADDIU R1, R1, #-8 7 (空转) 8 BNE R1, R2, Loop 9 习题6.8 在不进行指令调度的情况下,程序的实际执行情况如下: 指令流出时钟 Loop: L.D F0, 0(R1) 1 L.D F4, 0(R2) 2 (空转) 3 MUI.D F0, F0, F4 4 (空转) 5 (空转) 6 (空转) 7 ADD.D F2, F0, F2 8 DADDIU R1, R1, #-8 9 DADDIU R2, R2, #-8 10 BNE R1, R3, Loop 11 (空转) 12 计算原程序周期数: 每对元素所需的时钟周期数=12,其中空转数=5; 习题6.8 新程序 Loop: L.D F0,16(R1) ;F0 ←A(i+2) L.D F4,16(R2) ;F4 ←B(i+2) L.D F6,8(R1) ;F6 ←A(i+1) MUL.D F0,F0,F4 ;F0 ←A(i+2) ×B(i+2) L.D F8,8(R2) ;F8←B(i+1) L.D F10,0(R1) ;F10 ←A(i) MUL.D F6,F6,F8 ;F6 ←A(i+1) ×B(i+1) ADD.D F2,F0,F2 ; F2 ←F2+ A(i+2) ×B(i+2) L.D F12,0(R2) ;F12←B(i) DADDUI R1,R1,-24 ;R1 ←R1-24 MUL.D F10,F10,F12 ;F10 ←A(i) ×B(i) ADD.D F2,F6,F2 ; F2 ←F2+ A(i+1) ×B(i+1) DADDUI R2,R2,-24 ;R2 ←R2-24 BNE R1,R3,loop ;若R1 ≠R3,循环 (空转) ADD.D F2,F10,F2 ; F2 ←F2+ A(i) ×B(i) 新程序周期数:每对元素所需的时钟周期数=16/3=5.3,其中空转数=1/3=0.3 习题7.9(两级Cache ) 假设在3000次访存中,第一级cache不命中110次,第二级cache不命中55次。试问:在这种情况下,该cache系统的局部不命中率和全局不命中率各是多少? 解: 第一级cache不命中率(全局和局部)是110/3000,即3.67%; 第二级cache的局部不命中率是55/110,即50%; 第二级cache的全局不命中率是55/3000,即1.83%。 习题7.10(存储系统性能指标) 习题7.10 平均访问时间=命中时间+失效率×失效开销 平均访问时间1-路=2.0+1.4% *80=3.12ns 平均访问时间2-路=2.0*(1+10%)+1.0% *80=3.0ns 两路组相联的平均访问时间比较低 CPUtime=(CPU执行+存储等待周期)*时钟周期 CPUtime=(IC*CPI执行+总访存失效次数*失效开销) *时钟周期 =IC*(CPI执行*时钟周期+每条指令的访存次数*失效率*失效开销*时钟周期) CPU time 1-way=IC(2.0*2+1.2*0.014*80)=5.344IC CPU time 2-way=IC(2.2*2+1.2*0.01*80)=5.36IC 相对性能比:5.36/5.344=1
您可能关注的文档
- 计算机应用基础教程2.ppt
- 计算机应用基础 (2).ppt
- 计算机应用基础第三章操作系统.ppt
- 计算机操作员-复习题及答案.ppt
- 计算机微机原理8066指令.ppt
- 计算机操作基础(第三章) (2).ppt
- 计算机操作系统原理张海云版第2章.ppt
- 计算机操作系统课件-v2.ppt
- 计算机数学部分.ppt
- 计算机文化基础3.ppt
- 2017年江苏公务员考试《申论》真题(C类卷)及解析.pdf
- 2020年江苏公务员考试《申论》真题(C类)及参考答案.pdf
- 2010年425公务员联考《申论》卷及参考答案(广西、江苏、辽宁、天津、海南、湖南、蒙古、重庆、陕西、云南、宁夏).pdf
- 科学实验与观察-科学问题解决方法.pptx
- 长途运输:开创未来-掌握市场,提升物流服务.pptx
- 揭秘生活中的科学-提升科学素养,探索万物奥秘.pptx
- 携手家长,共育明日之星-优化教师家长协作机制.pptx
- 2024年台历挂历 A4可编辑打印 日历 月历 可记事 含农历,有周数,周日.pdf
- 2024年学生会五月份工作计划真题 .pdf
- 2024年安全工作例会管理制度(3篇) .pdf
最近下载
- 2025年湖南石油化工职业技术学院单招职业技能测试题库(各地真题).docx VIP
- 上海市六年级(下)数学同步讲义 第11讲 一元一次不等式(组)及其解法.doc VIP
- 人教版语文七年级下 列夫托儿斯泰课件(共45张PPT).pptx VIP
- 佳能(Canon )PowerShot SX系列 PowerShot SX1 IS 说明书.pdf
- 1.2 太空探索课件-七年级地理上学期中图版(2024).pptx VIP
- 人教版小学一年级数学课件- 两位数加一位数(不进位)、整十数.ppt
- 四人赛全真总题库(共3000题).docx VIP
- 2025新外研社版英语七年级下单词表(英译汉).docx
- 幼儿园大班语言:傻小熊进城.doc VIP
- 小肠梗阻的诊断与治疗中国专家共识(2023年版).pptx
文档评论(0)