实验4 Tomasulo算法.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验4 Tomasulo算法

西安邮电大学(计算机学院)课内实验报告实验名称:Tomasulo算法专业名称:计算机科学与技术班级:学生姓名:学号(8位):指导教师:实验日期:实验4Tomasulo算法1 实验目的加深对指令级并行性及开发的理解。加深对Tomasulo算法的理解。掌握Tomasulo算法在指令流出、执行、写结果各阶段对浮点操作指令以及load和store指令进行了什么处理。掌握采用了Tomasulo算法的浮点处理部件的结构。掌握保留站的结构。给定被执行的程序片段,对于具体某个时钟周期,能够写出保留站、指令状态表以及浮点寄存器状态表内容的变化情况。2 实验平台采用Tomasulo算法模拟器。3 实验内容和步骤首先要掌握Tomasulo算法模拟器的使用方法(见随附的ppt)。 1)、假设浮点功能部件的延迟时间为:加减法2个时钟周期,乘法10个时钟周期,除法40个时钟周期,Load部件2个时钟周期。 (1)对于下面的代码段,给出当指令MUL.D写结果时,保留站、Load缓冲器以及寄存器状态表中的内容。 L.D F6,24(R2) L.D F2,12(R3) MUL.D F0,F2,F4 SUB.D F8,F6,F2 DIV.D F10,F0,F6 ADD.D F6,F8,F2当指令MUL.D写结果时,保留站中内容如下表所示:当指令MUL.D写结果时,load缓冲器中内容如下表所示:当指令MUL.D写结果时,寄存器状态表中的内容如下表所示:(2)按单步方式执行上述代码,利用模拟器的对比显示功能,观察每一个时钟周期前后各信息表中内容的变化情况。周期1:取出第一条指令L.D F6,24(R2),地址偏移量24写入LOAD1,LOAD1名存入寄存器F6。周期2:取出第二条指令L.D F2,12(R3),地址偏移量12写入LOAD2,LOAD2名存入寄存器F2,同时第一条指令开始执行,LOAD1上写入绝对地址。?周期3:取出第三条指令MUL.D F0,F2,F4,第一条指令完成,第二条指令开始执行,LOAD2上写入绝对地址。保留站中存入待运算的操作数和操作。寄存器F0上QI写入保留站中待运算命令的名称。?周期4:取出第四条指令SUB.D F8,F6,F2,第二条指令执行完成,第一条指令写入结果M1到寄存器F6,保留站中存入第四条指令的待运算操作数和操作。LOAD1清空。周期5:取出第五条指令DIV.D F10,F0,F6,第二条指令写结果M2到寄存器F2,LOAD2清空。保留站中存入第五条指令的待运算操作数和操作?周期6:取出第六条指令ADD.D F6,F8,F2,第三条和第四条指令开始执行,相关的操作数和操作符被存入保留站?周期7:第四条指令执行完成,保留站中的第三条指令继续执行。?周期8:第四条指令写结果M3到寄存器F8,保留站中存放第四条指令的位置清空,第三条指令继续执行。周期9:第六条指令开始执行。第三条指令继续执行。周期10:第六条指令执行完成,第三条指令继续执行。周期11:第六条指令写结果M4到寄存器F6中,清空保留站中原来存放第六条指令的位置。第三条指令继续执行。周期12~15:第三条指令继续执行,直到完成。?周期16:第三条指令写结果M5到寄存器F0,保留站中原来存放第三条指令的位置清空。周期17~56:第五条指令开始执行,直到结束?周期57:第五条指令执行结束后写结果M6到F10,保留站中原来存放第五条指令的位置清空。2)、对于上面相同的延迟时间和代码段:给出在第3个时钟周期时,保留站、Load缓冲器以及寄存器状态表中的内容。步进5个时钟周期,给出此时保留站、Load缓冲器以及寄存器状态表中的内容。再步进10个时钟周期,给出此时保留站、Load缓冲器以及寄存器状态表中的内容。在第3个时钟周期时,保留站内容如下表所示:在第3个时钟周期时,load缓冲器内容如下表所示:在第3个时钟周期时,寄存器状态表内容如下表所示:步进5个时钟周期后,保留站内容如下表所示:load缓冲器内容如下表所示:寄存器状态表中内容如下表所示:再步进10个时钟周期后,保留站内容如下表所示:load缓冲器内容如下表所示:寄存器状态表中内容如下表所示: 3)、假设浮点功能部件的延迟时间为:加减法3个时钟周期,乘法8个时钟周期,除法40个时钟周期,自己编写一段程序,重复上述步骤(2)的工作。并给出通过此项工作,得出什么结论?L.DF12,20(R5)L.DF2,10(R6)MUL.DF6,F2,F10SUB.DF0,F8,F2DIV.DF10,F0,F12ADD.DF8,F12,F2(1)?在第3个时钟周期时,保留站内容如下表所示:4 实验总结与心得本次实验主要是借助T

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档