- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
例1.2 用一台4OMHz处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下: 指令类型 指令条数 时钟周期数 整数运算 45000 1 数据传送 32000 2 浮点运算 15000 2 控制传送 8000 2 求有效CPI、MIPS速率和程序的执行时间。 解:依题意可知 IN=105条,n=4 解:依题意可知 IN=2×105条,n=4, 流水线技术 作5.17 在CRAY-1机上,设向量长度均为64,所有浮点功能部件的执行时间分别为:相加需6拍,相加需7拍,求倒数近似值需14拍,从存储器读数据需6拍,打入寄存器及启动功能部件各需1拍,问下列个指令组,组内的哪些指令可以链接?,哪些指令不可以链接?不能链接的原因是什么?并分别计算各指令组全部完成所需的拍数。 解: 组(1)三条指令可并行执行。 T=1+7+1+64-1=72(拍)。 组(2)前二条指令可并行执行,前两条与第三条指令可链接执行。 T=(1+7+1+1+6+1)+63=80(拍)。 组(3) 前3条指令可链接执行,后一条指令只能串行(加法部件冲突) T=(8+9+8+63)+8+63=159(拍)。 组(4)前二条指令可并行执行,后两条可链接,这样前两条与后两条指令可链接执行。 T=(16)+(9)+(8)+63=94(拍)。 某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令三类,并假设每个地址字段的长度均为6位。 (1)?? 如果双地址指令有15条,单地址指令和零地址指令的条数基本相同,问单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。 (2)?? 如果要求三类指令的比例大致为1:9:9,问双地址指令、单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。 ? ? [解答] (1)???????? 首先,我们可以根据指令地址的数量来决定各种指令在指令空间上的分布: 如果我们按照从小到大的顺序分配操作码,这样,按照指令数值从小到大的顺序,分别为双地址指令、单地址指令和零地址指令。 其次可以根据指令的条数来大致的估计操作码的长度: 双指令15条,需要4位指令来区分,剩下的12位指令平均分给单地址和零地址指令,每种指令可以用6位指令来区分,这样,各指令的条数为: 双地址指令15条,地址码:0000~1110; 单地址指令26-1=63条,地址码:1111 000000~1111 111110; 零地址指令64条,地址码:1111 111111 000000~1111 111111 111111。 (2)与上面的分析相同,可以得出答案: 双地址指令14条,地址码:0000~1101; 单地址指令26*2-2 = 126条,1110 000000~1110 111110,1111 000000~1111 111110; 零地址指令128条1111 111111 000000~1111 111111 111111。 * * * 例1.1 假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少? 解:由题意可知 fe=0.4, re=10, 根据Amdahl定律 作1.13 假设高速缓存Cache工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache后,能使整个存储系统获得多高的加速比? 解:fe=0.9 ,re=5 作1.12 假设在一台40MHz处理机上运行200 000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下: 10% 8 Cache失效时访问主存 12% 4 转移 18% 2 Cache命中的加载/存储 60% 1 算术和逻辑运算 指令混合百分比 CPI 指令类型 (1)计算在单处理机上用上述踪数据运行程序的平均CPI。 (2)根据(1)所得CPI,计算相应的MIPS 速率。 例4.2 假设高速缓存Cache的访问周期为50ns,主存的访问周期为400ns ,且Cache被访问命中的概率为95%,则采用Cache后,能使整个存储系统等效的访问周期为多少?获得多高的加速比? 解: 例5. 2 以浮点加法运算为例(四段流水线)各段时间相等,求吞吐率、效率、加速比。 求Z=A+B+C+D+E+F+G+H,TP、E、Sp (注意有相关) Z=A+B+C+D+E+F+G+H 1 2 3 4 5
原创力文档


文档评论(0)