计算机系统结构实验三DLX处理器程序设计教程.docxVIP

计算机系统结构实验三DLX处理器程序设计教程.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构实验三DLX处理器程序设计教程

实验三????DLX处理器程序设计 1.实验目的? 学习使用DLX汇编语言编程,进一步分析相关现象。 2.代码清单及注释说明 .data VectorLength: .word 16 Vector1: .double 1.923101,2.149914,3.453894,4.316657,5.243715,6.274374,7.896253,8.453792,9.457121,10.452391,11.316422,12.965313,13.128674,14.456345,15.443476,16.976347 Vector2: .double 1.453444,2.253445,3.976833,4.545744,5.671645,6.145456,7.976447,8.963118,9.643178,10.346149,11.974138,12.346127,13.967316,14.316485,15.976314,16.346273 Printf1: .asciiz The result is\n Printf2: .asciiz %f\t .align 2 PrintfHead: .word Printf1 PrintfValue: .word Printf2 result: .space 8 .text main: addi r14,r0,PrintfHead trap 5 lw r20,VectorLength addi r2,r0,0 loop: ld f0,Vector1(r2) ld f2,Vector2(r2) addd f4,f0,f2 sd result,f4 addi r14,r0,PrintfValue trap 5 addi r2,r2,8 subi r20,r20,1 bnez r20,loop trap 0 3.程序相关性分析结果 载入ADD.S,执行。 运行结果: 数据统计: 有数据相关(RAW相关),控制相关 总共执行周期为365,数据相关为146(40.00%),控制相关为15(4.11%)。 3.1观察程序中出现的数据/控制/结构相关 3.1.1数据相关 指令组合: subi r16,r16,0x1 bnez r16,Loop 后者的条件判断需要等到前者执行完。 指令组合: addd f4,f2,f0 ad Result(r0),f4 存在RW相关 3.1.2控制相关 指令组合: Bnez r16,Loop Trap 0x0 前者执行到ID段时转移指令成功转移,后者则执行完IF段后就断流。 3.2增加浮点运算部件 总共执行周期为365,数据相关为146(40.00%),控制相关为15(4.11%)。 通过观察该图可知,增加浮点运算部件数量不能改善流水线的性能。 3.3增加forward部件 由图可知:执行周期总数为299,数据相关80(26.76%),控制相关为15(5.02%)。 增加forward部件后,执行总周期书减少,数据相关减少,控制相关不变。加速比为365/299 = 1.22 3.4转移指令的影响 (1)转移成功 (2)转移失败 由上面可以看出,当转移成功时,已经进入取指阶段的指令被放弃,转入转移的目标指令的取指操作,这就造成了流水线的断流;若转移失败,已经进入取指阶段的指令继续进入译码阶段,流水线不断流。 ·实验总结 在实验中,WinDLX所加载的.s文件不要出现中文格式,不然会导致加载失败 ,在编写双精度浮点数运算时有些对于指令掌握不熟练,并且双精度double型运算指令,其所有的运算指令名称上面都要加上“d”才ok。而如果是单精度的,则需要添加字母“f”;其次,对于浮点数的相关设置,包括状态寄存器和浮点寄存器都需要在实验之前查资料了解透彻,不然在试验中就会有语法错误。 通过此次实验我对实验二所进行的数据相关、控制相关、结构相关的性能分析做了更深入的了解,以及对于功能部件对流水线的影响,forwarding技术对流水线的影响,还有就是静态指令调度等。 通过自行编写向量矢量算法,在代码中初始化两个向量,按照分量顺序进行运算。当然,如果想要改变源向量,直接处理代码中的相关数据即可。 总之,该实验主要着重对浮点运算以及对于流水线的相关影响及性能分析,收获很大。

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档