- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本科教学实验讲义
(实验)课程名称 计算机体系结构
学 院(部、中心): 信息学院
执 笔 人(签字): 唐 斌
审 核 人(签字):
编 写 时 间: 2016.7.9
贵州财经大学教务处印制
年 月 日
实验一 流水线技术
一、实验目的
加深对计算机流水线基本概念的理解;
理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作;
加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响;
进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。
加深对指令调度和延迟分支
熟练掌握用指令调度技术来解决流水线中的数据冲突的方法;
进一步理解指令调度技术和延迟分支技术.
ID/EX.A:
ID/EX.B:
ID/EX.Imm:
ID/EX.IR:
EX/MEM.ALUo:
EX/MEM.IR:
MEM/WB.LMD:
MEM/WB.ALUo:
MEM/WB.IR:
2、流水线中的冲突structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中);
(2)执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件;
(3) 记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期数
的百分比;
(4)把浮点加法器的个数改为6个;
(5)再次重复上述(1)~(3)的工作;
(6)分析结构冲突对CPU性能的影响,讨论解决结构冲突的方法。
c. 观察数据冲突并用定向技术来减少停顿,步骤如下:
(1)把浮点加法器的个数改为1个;
(2)加载data_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中);
(3)关闭定向功能。这是通过在“配置”菜单中去选“定向”
(4)用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出
在什么时刻发生了RAW(先写后读)冲突;
记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算停
顿时钟周期数占总执行周期数的百分比;
(6)复位CPU;
(7)打开定向功能。这是通过在“配置”菜单中勾选“定向”
(8)用单步执行一周期的方式(F7)执行该程序,同时查看时钟周期图,列出在
什么时刻发生了RAW(先写后读)冲突,并与(3)的结果进行比较;
记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数。计算采
用定向技术后性能提高的倍数。
3. 指令调度
a. 启动MIPSsim。
b. 勾选配置菜单中的“流水方式”,使模拟器工作于流水方式下。
c. 用指令调度技术解决流水线中的结构冲突与数据冲突。
加法﹑乘法﹑除法部件的个数设置为两个,延迟时间都设置为3个时钟周期;
加载schedule.asm关闭定向功能。
执行载入的程序,查看统计数据和时钟周期图,找出并记录程序执行过程中各种冲突发生的次数、发生冲突的指令组合,以及程序执行的总时钟周期数;
采用指令调度技术对程序进行指令调度,消除冲突。将调度后的程序放到after-schedule.asm中;
载入after-schedule.asm;
执行该程序,观察程序在流水线中的执行情况,记录程序执行的总时钟周期数;
根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU性能的作用。
4. 用延迟分支减少分支指令对性能的影响。
a. 启动MIPSsim;
b. .载入branch.asm,关闭延迟分支功能。
执行该程序,观察并记录发生分支延迟的时刻,保存下其时钟周期图(可用拷屏的方法);
记录执行该程序所花的总时钟周期数;
假设延迟槽为一个,对branch.asm进行指令调度,然后存到delayed-branch.asm中;
载入delayed-branch.asm;
打开延迟分支功能;
执行该程序,观察其时钟周期图,保存下其时钟周期图;
记录执行该程序所花的总时钟周期数;
对比上述两种情况下的时钟周期图;
根据记录结果,比较没采用延迟分支和采用了延迟分支的
文档评论(0)