北邮大三计算机体系结构实验三DLX处理器程序设计.pdfVIP

  • 2
  • 0
  • 约5.33千字
  • 约 12页
  • 2021-09-23 发布于重庆
  • 举报

北邮大三计算机体系结构实验三DLX处理器程序设计.pdf

北邮大三计算机体系结构实验 三 DLX处理器程序设计 ———————————————————————————————— 作者: ———————————————————————————————— 日期: 实验三 DLX 处理器程序设计 1. 实验目的 学习简单编译优化方法 ,观察采用编译优化方法所带来的性能的提高。 2. 实验原理 采用静态调度方法重排指令序列,减少相关 ,优化程序。 3、实验内容和要求 自编一段汇编代码,完成一维向量加法运算,并输出结果。观察程序中出现的 数据 / 控制 / 结构相关。 (注:使用一维数组表示一维向量。 ) 4.1 向量加法代码清单及注释说明 1、向量加法设计源代码 .da ta VectorLe ng th: .word 16 Ve ctor1 : .w ord 1, 2,3,4 ,5,6 ,7,8, 9,10,11,1 2,1 3,14 , 15,16 Ve ctor2 : .w or d 1,2,3 ,4 ,5,6,7 ,8 ,9,10, 11, 12,13,1 4, 15,16 ;声明向量长度 以及声明向量 1、2 P rint f1: . asciiz "Vector = Pr intf2: .ascii z %f .al ign 2 PrintPr om pt: .word Printf1 Pri ntPa r: .word Pri ntf2 Re sult: .s pa ce 4 ;存放打印数据的空间申请 .tex t ma in : ad di r 14,r0, Pri nt Prompt tr ap 5 lw r20,Ve ctorLen gth a ddi r2,r0 ,0 Loop: ld f10,V ector1( r2) ld f12,Ve ctor 2( r2) ;循环体中读入向量 cvti2d f0,f1 0 c vti2d f2, f12 addd f 4, f2,f 0 ;加法运算 Fi nis h:; ** ** Fin ish,write result into st dout s d Result,f4 add i r1 4, r0 ,Pr intPar trap 5 ;系统中断,输出结果 add i r2,r2,4 s ubi r20 ,r2 0, 1 b nez r 20, Loo p ; **** E nd trap 0 2、运行结果 5.1 程序相关性分析结果 (1) 观察程序中出现的数据 / 控制 / 结构相关。指出程序中出现上述现象的指 令组合。 产生3 4 .12%的数据相关。 当对当前指令的操作数寄存器进行操作的时候 ,前几 条指令的运算结果还未写回结果寄存器 ,由此产生数据相关。 没有产生结构相关。 产生 3.94%的控制相关。系统按照预测成功来执行指令 ,执行一条指令后马上将其 下一条指令 trap 读进来。 ( 2)考察增加浮点运算部件对性能的影响。 1 个浮点运算部件 3个浮点运算部件 同一段代码执行相同步, 但是经过对比发现浮点运算部件的多少对于程序执行效 率并没有什么影响 ,浮点运算部件的多少对统计结果都不造成影响,可能是由于 该程序不存在争用浮点运算部件资源的情况 (3)考察增加 f orward 部件对性能的影响。 不使用 forward 部件 使用 for wa rd 部件 使用 for war d部件之后执行相同的代码用的时钟周期比不使用

文档评论(0)

1亿VIP精品文档

相关文档