计算机体系结构.pptx

计算机体系结构;2019/4/29;系统结构的Flynn分类 (1966);Levels of Parallelism;;2019/4/29;;2019/4/29;2019/4/29;;; 6 clocks: 通过循环展开4次是否可以提高性能?; 10 clocks: 是否可以通过调整代码顺序使stalls减到最小; Rewrite loop to minimize stalls?;代码移动后 SD移动到SUBI后,注意偏移量的修改 Loads移动到SD前,注意偏移量的修改 ;2019/4/29;2019/4/29;;2019/4/29;2019/4/29; 1 Loop: LD F0,0(R1) 2 ADDD F4,F0,F2 3 SD 0(R1),F4 ;drop SUBI BNEZ 4 LD F0,-8(R1) 5 ADDD F4,F0,F2 6 SD -8(R1),F4 ;drop SUBI BNEZ 7 LD F0,-16(R1) 8 ADDD F4,F0,F2 9 SD -16(R1),F4 ;drop SUBI BNEZ 10 LD F0,-24(R1) 11 ADDD F4,F0,F2 12 SD -24(R1),F4 13 SUBI R1,R1,#32 ;alter to 4*8 14 BNEZ R1,LOOP 15 NO

文档评论(0)

1亿VIP精品文档

相关文档