- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
试验一流水线中相关
一.试验目标
1.熟练掌握WinDLX模拟器操作和使用,熟悉DLX指令集结构及其特点;
2.加深对计算机流水线基础概念了解;
3.深入了解DLX基础流水线各段功效和基础操作;
4.加深对数据相关、结构相关了解,了解这两类相关对CPU性能影响;
5.了解处理数据相关方法,掌握怎样使用定向技术来降低数据相关带来暂停。
二.试验平台
WinDLX模拟器
预备知识
1.WinDLX
WinDLX模拟器是一个图形化、交互式DLX流水线模拟器,能够演示DLX流水线
是怎样工作。该模拟器能够装载DLX汇编语言程序(后缀为“.s”文件),然后单步、设
断点或是连续实施该程序。CPU寄存器、流水线、I/O和存放器全部能够用图形表示出来,
以形象生动方法描述DLX流水线工作过程。模拟器还提供了对流水线操作统计功效,
便于对流水线进行性能分析。
相关WinDLX具体介绍,见WinDLX教程。
2.熟悉WinDLX指令集和WinDLX源代码编写
3.复习和掌握教材中对应内容
(1)DLX基础流水线
(2)流水线结构相关和数据相关
?结构相关:当指令在重合实施过程中,硬件资源满足不了指令重合实施要求,
发生资源冲突时,将产生“结构相关”。
?数据相关:当一条指令需要用到前面指令实施结果,而这些指令均在流水线中
重合实施时,就可能引发“数据相关”。
(3)定向技术关键思想:在发生数据相关时,等候前面计算结果指令并不一定真
立即就用到该计算结果,假如能够将该计算结果从其产生地方直接送到其它指令
需要它地方,就能够避免暂停。
试验内容及结果
1.用WinDLX模拟器实施下列三个程序(任选一个):
?求阶乘程序fact.s
?求最大公倍数程序gcm.s
?求素数程序prim.s
分别以步进、连续、设置断点方法运行程序,观察程序在流水线中实施情况,
观察CPU中寄存器和存放器内容。熟练掌握WinDLX操作和使用。
注意:fact.s中调用了input.s中输入子程序。load程序时,要两个程序一起装入
(全部select后再点击load)。gcm.s也是如此。
说明:此试验我们选择:求阶乘程序fact.s
1)用WinDLX模拟器实施求阶乘程序fact.s。
2)程序作用:这个程序说明浮点指令使用。该程序从标准输入读入一个整数,求其阶乘,然后将结果输出。该程序中调用了input.s中输入子程序,这个子程序用于读入正整数。
3)试验结果:
i.分别以步进、连续、设置断点方法运行程序
图1.求阶乘程序fact.s运行统计数据步进方法运行
图2求阶乘程序fact.s运行统计数据连续方法运行
图3求阶乘程序fact.s运行统计数据连续方法运行
ii.数据统计
图1.1.4求阶乘程序fact.s运行统计数据
图5求阶乘程序fact.s流水线实施情况
图6求阶乘程序fact.s寄存器使用情况
iii.定向非定向分析
在载入fact.s和input.s以后,不设置任何断点运行。
A.不采取重新定向技术,我们得到结果:
B.采取定向技术,我们得到结果:
结果分析
从上面数据我们能够
从上面数据我们能够看出定向作用:
在定向技术存在情况下Statistics窗口中多种统计数字:总周期数(215)和暂停数(17RAW,25Control,12Trap;54Total)
在定向技术不存在时候,控制暂停和Trap暂停仍然是一样值,而RAW暂停从17变成了53,总模拟周期数增加到236。所以定向技术带来加速比:
S=236/215=1.098
所以:DLXforwarded比DLXnotforwarded快9.8%。
2.用WinDLX运行程序structure_d.s,经过模拟:
?找出存在结构相关指令对和造成结构相关部件;
?统计由结构相关引发暂停时钟周期数,计算暂停时钟周期数占总实施周期数百
分比;
?叙述结构相关对CPU性能影响,讨论处理结构相关方法。
1)模拟结果:
图2.1程序structure_d.s流水线实施过程
图2.2程序structure_d.s运行统计信息
2)结构相关
i.图,造成结构部件:浮点数寄存器f4
adddf0,f0,f4指令在译码阶段ID停滞1周期
ii.图造成结构相关部件:ALU
addir2,r2,0x8指令在实施阶段intEX
原创力文档


文档评论(0)