计算机体系结构实验报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验一流水线中的相关 一.实验目的 熟练掌握WinDLX模拟器的操作和使用,熟习DLX指令集结构及其特色; 加深对计算机流水线基本看法的理解; 进一步认识DLX基本流水线各段的功能以及基本操作; 4.加深对数据相关、结构相关的理解,认识这两类相关对CPU性能的影响; 认识解决数据相关的方法,掌握如何使用定向技术来减少量据相关带来的暂停。 二.实验平台 WinDLX模拟器 三.预备知识 1.WinDLX WinDLX模拟器是一个图形化、交互式的DLX流水线模拟器,可以演示DLX流水线 是如何工作的。该模拟器可以装载DLX汇编语言程序(后缀为“.s”的文件),而后单步、设断点或是连续执行该程序。CPU的寄存器、流水线、I/O和储存器都可以用图形表示出来,以形象生动的方式描述DLX流水线的工作过程。模拟器还供给了对流水线操作的统计功能,便于对流水线进行性能解析。 相关WinDLX的详细介绍,见WinDLX教程。 熟习WinDLX指令集和WinDLX源代码的编写 复习和掌握教材中相应的内容 1)DLX基本流水线 2)流水线的结构相关与数据相关 结构相关:当指令在重叠执行过程中,硬件资源满足不了指令重叠执行的要求, 发生资源矛盾时,将产生“结构相关”。 数据相关:当一条指令需要用到前面指令的执行结果,而这些指令均在流水线中重叠执行时,即可能惹起“数据相关”。 3)定向技术的主要思想:在发生数据相关时,等候前面计算结果的指令其实不必定真的立刻就用到该计算结果,假如可以将该计算结果从其产生的地方直接送到其余指令 需要它的地方,就可以防备暂停。 四.实验内容及结果 1.用WinDLX模拟器执行以下三个程序(任选一个): 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运转程序,观察程序在流水线中的执行状况, 观察CPU中寄存器和储存器的内容。熟练掌握WinDLX的操作和使用。 注意:fact.s中调用了input.s中的输入子程序。load程序时,要两个程序一起装入 (都select后再点击load)。gcm.s也是这样。 说明:此实验我们选择:求阶乘程序  fact.s 1)用WinDLX模拟器执行求阶乘程序fact.s。 2)程序的作用:这个程序说明浮点指令的使用。该程序从标准输入读入一个整数,求其 阶乘,而后将结果输出。该程序中调用了整数。  input.s中的输入子程序,这个子程序用于读入正 3)实验结果: i.分别以步进、连续、设置断点的方式运转程序 图1.求阶乘程序fact.s运转统计数据步进方式运转 图2求阶乘程序fact.s运转统计数据连续方式运转 图3求阶乘程序fact.s运转统计数据连续方式运转 数据统计 图求阶乘程序fact.s运转统计数据 图5求阶乘程序fact.s流水线执行状况 图6求阶乘程序fact.s寄存器使用状况 定向非定向解析 在载入fact.s和input.s以后,不设置任何断点运转。 不采纳重新定向技术,我们获得的结果: 采纳定向技术,我们获得的结果: 结果解析 从上边的数据我们可以看出定向的作用: 在定向技术存在的状况下 Statistics 窗口中的各种统计数字:总的周期数 (215)和暂 停数(17RAW,25Control,12Trap;54Total) 在定向技术不存在时候, 控制暂停和 Trap暂停仍旧是相同的值, 而RAW暂停从17 变为了53,总的模拟周期数增添到236。所以定向技术带来的加快比: S=236/215=1.098 所以:DLXforwarded比DLXnotforwarded 快9.8%。 2.用WinDLX运转程序structure_d.s,经过模拟: 找出存在结构相关的指令对以及以致结构相关的零件; 记录由结构相关惹起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的百分比; 论述结构相关对CPU性能的影响,谈论解决结构相关的方法。 1)模拟结果: 图2.1程序structure_d.s流水线执行过程 图2.2程序structure_d.s运转统计信息 2)结构相关 i.如图,以致结构的零件:浮点数寄存器f4 adddf0,f0,f4指令在译码阶段ID阻滞1周期 ii.如图以致结构相关的零件: addir2,r2,0x8指令在执行阶段  ALU intEX  阻滞  1周期 3)结果解析 由资源相关惹起的暂停周期数为:30 总执行周期数为:139 暂停周期数占总执行周期数的百分比:21.58% 解析:资源相关使相关指令在流水线上阻滞,降低了执行效率。 4)解决方法 在合理的指令调换范围内,尽量防备执行重复的指令。尽量防备同一寄存器的屡次使用,若没法防备,则使用寄存器换名的方法。也可以考虑采纳资源重

文档评论(0)

150****7287 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档