- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
流水技术实验研究
计算机体系结构
实验四 流水技术的实验研究
实验理解:
通过本实验,加深对结构相关和数据相关的理解,了解结构相关和数据相关对CPU性能的影响,掌握如何使用定向技术来减少数据相关带来的暂停。
实验过程:
A.使用WinDLX模拟器对Fact.s:
观察程序中出现的数据相关、控制相关和结构相关现象。
数据相关:
Lbu r3,0x0(r2)
Seqi r5,r3,0xa
下一条指令要用到上一条指令的r3,因此存在数据相关,因此在一个周期的停顿后用定向技术处理了。
控制相关:
由于采取预取技术,所以导致下一条指令执行了“IF”,但是结果是分支成功后将会终止这条指令,执行跳转后的指令。
结构相关:
由于浮点计算的运算周期比整形更长,所以存在结构相关,下一条指令不得不等到上一条指令执行完。
考察设置相关专用通路技术对于减少相关现象的作用。
采用Forwarding技术:
不采用Forwarding技术:
以上是测试输入数据为5时的统计结果,非常明显可知:
不采用定向技术后,总的周期数增加了17.9%,原因来自于相关造成的停顿。
数据相关是原来的2.8倍,定向技术原本就是为了解决数据相关。
结构相关原本也会增加,这个统计表中无法体现,这一点上一次实验就有说明。
考察增加浮点运算部件时性能的影响。
浮点运算的参数设置:
更改加法单元
结果并没有改善,原因在于加法部件没有造成冲突。
更改乘法单元
结果仍然没有改善,乘法部件没有产生结构冲突。
更改除法单元
结果没有改善。
综上可知增加浮点运算部件,其实对流水线并无本质上的影响。
观察转移指令在转移成功和不成功时的流水线开销。
两个设定条件:
除c外,浮点加、乘、除单元只有一个。
本题中所有浮点运算单元的延时均为4个周期。
1.分支成功
2.分支失败
由于流水线是预测失败,所以如果转移不成功,对流水线没有影响,直接执行它预取的指令。然而如果转移成功,则需要清空下面的流水线,重新读入转移的目标位置,这对流水线的效率是有些影响的。
B.用DLX汇编语言编写矩阵乘的程序:
1、主函数:主要用于参数的读入。
2、Loop1:读出矩阵A的元素。
3、loopA和outputA:循环输出A 的元素。
4、continueB和loop2:读入矩阵B的元素。
5、loopB和outputB:输出显示B的元素。
6、矩阵计算。
7、结果存储:计算结果存储在矩阵C。
8、结果输出:循环输出存储在矩阵C中的内容。
C.程序运行结果如下:
D.使用WinDLX模拟器对程序的运行。
观察程序中出现的数据相关、控制相关和结构相关现象。
数据相关:
Subi r3,r3,0x30
add r1,r1,r3
下一条指令要用到上一条指令的r3,因此存在数据相关,所以执行前进行了长时间的停顿。
控制相关:
由于采取预取技术,所以导致下一条指令执行了“IF”,但是结果是分支成功后将会终止这条指令,执行跳转后的指令。
结构相关:
因为上一指令的停顿导致下一指令的停顿是典型的结构相关,但是统计表中一般不会显示,原因在于统计表中往往对第一次出现的进行计数,所以这里的结构相关算成数据相关。
考察设置相关专用通路技术对于减少相关现象的作用。
采用Forwarding技术:
不采用Forwarding技术:
以上的输入数据在前面的截图中已经显示,、非常明显可知:
不采用定向技术后,总的周期数增加了26.8%,这个结果比第一个程序要高10%左右,可见这里的相关更加多。
数据相关是原来的2.4倍,而其他相关没有改变(统计数据中),可见定向对解决数据相关的作用性,然而每一个数据相关导致的暂停基本都会导致后续几条指令的结构相关,但是由于重复,所以统计不计数。
考察增加浮点运算部件时性能的影响。
浮点运算的参数设置:
更改加法单元
结果并没有改善,原因在于加法部件没有造成冲突。
更改乘法单元
结果仍然没有改善,乘法部件没有产生结构冲突。
更改除法单元
结果没有改善。
综上可知增加浮点运算部件,其实对流水线并无本质上的影响。
观察转移指令在转移成功和不成功时的流水线开销。
两个设定条件:
除c外,浮点加、乘、除单元只有一个。
本题中所有浮点运算单元的延时均为4个周期。
1.分支成功
2.分支失败
实验总结:
我对流水线的理解:流水线并非完全都是优点,绝无缺点,完美无缺的事物世上少有。
流水线的优点:
减少了处理器执行指令所需要的时钟频率周期,在通常情况下增加了指令的输入频率。一些集成电路,例如加法器或者乘法器时,通过添加更多的环路使其工作得更快。如果以流水线替代,能相对地减少环路。
没有流水线的优点:
非流水线的处理器每次(a
文档评论(0)