计算机系统结构第4章指令级并行及限制.pptVIP

  • 8
  • 0
  • 约1.71万字
  • 约 105页
  • 2017-03-18 发布于贵州
  • 举报

计算机系统结构第4章指令级并行及限制.ppt

计算机系统结构第4章指令级并行及限制计算机系统结构第4章指令级并行及限制

第四章 指令级并行及限制 4.1 指令级并行的概念 1、流水线处理机的实际CPI 理想流水线的CPI加上各类停顿的时钟周期数: CPI流水线 = CPI理想 + 停顿结构冲突 + 停顿数据冲突 + 停顿控制冲突 理想CPI是衡量流水线最高性能的一个指标。 IPC:Instructions Per Cycle (每个时钟周期完成的指令条数) 2、基本程序块 基本程序块:一段除了入口和出口以外不包含其他分支的线性代码段。 程序平均每5~7条指令就会有一个分支。 3、循环级并行:使一个循环中的不同循环体并行执行。 开发循环体中存在的并行性 最常见、最基本 是指令级并行研究的重点之一 例如,考虑下述语句: for (i=1; i=500; i=i+1) a[i]=a[i]+s; 每一次循环都可以与其他的循环重叠并行执行; 在每一次循环的内部,却没有任何的并行性。 4、最基本的开发循环级并行的技术 循环展开(loop unrolling)技术 采用向量指令和向量数据表示 静态调度 依靠编译器对代码进行静态调度,以减少相关和冲突。 它不是在程序执行的过程中、而是在编译期间进行代码调度和优化。 通过把相关的指令拉开距离来减少可能产生的停顿。 动态调度 在程序的执行过程中,依靠专门硬件对代码进行调度,减少数据相关导致的停顿。 标量是相对于向量而言的,一个

文档评论(0)

1亿VIP精品文档

相关文档