计算机系统结构第4章指令级并行及限制计算机系统结构第4章指令级并行及限制.ppt

计算机系统结构第4章指令级并行及限制计算机系统结构第4章指令级并行及限制.ppt

  1. 1、本文档共105页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机系统结构第4章指令级并行及限制计算机系统结构第4章指令级并行及限制

第四章 指令级并行及限制 4.1 指令级并行的概念 1、流水线处理机的实际CPI 理想流水线的CPI加上各类停顿的时钟周期数: CPI流水线 = CPI理想 + 停顿结构冲突 + 停顿数据冲突 + 停顿控制冲突 理想CPI是衡量流水线最高性能的一个指标。 IPC:Instructions Per Cycle (每个时钟周期完成的指令条数) 2、基本程序块 基本程序块:一段除了入口和出口以外不包含其他分支的线性代码段。 程序平均每5~7条指令就会有一个分支。 3、循环级并行:使一个循环中的不同循环体并行执行。 开发循环体中存在的并行性 最常见、最基本 是指令级并行研究的重点之一 例如,考虑下述语句: for (i=1; i=500; i=i+1) a[i]=a[i]+s; 每一次循环都可以与其他的循环重叠并行执行; 在每一次循环的内部,却没有任何的并行性。 4、最基本的开发循环级并行的技术 循环展开(loop unrolling)技术 采用向量指令和向量数据表示 静态调度 依靠编译器对代码进行静态调度,以减少相关和冲突。 它不是在程序执行的过程中、而是在编译期间进行代码调度和优化。 通过把相关的指令拉开距离来减少可能产生的停顿。 动态调度 在程序的执行过程中,依靠专门硬件对代码进行调度,减少数据相关导致的停顿。 标量是相对于向量而言的,一个只有大小的量称为标量,而将既有大小又有方向的量称为向量。当然,向量中的某一个分量也是标量。 如果处理机每条指令的处理对象是一个或一对(如两个标量相加)标量,这种处理机称为标量处理机。 如果标量处理机内部存在多条指令流水线,则称为超标量处理机。 1.单发射与多发射 处理机从指令存储单元(或指令分配单元)取得指令的过程称为“发射”。 如果一个处理机在单个时钟周期中只能取出一条指令供执行,就称为单发射处理机。 如果在一个时钟周期内可以同时取得多条指令的处理机可以称为多发射处理机。 时钟周期 指令 I1 I2 I3 5 1 2 3 4 IF ID EX WR IF ID EX WR IF ID EX WR 时钟周期 指令 I6 I1 I2 I3 I4 I5 1 2 3 4 5 EX WR IF ID IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR (a) 单发射 (b)多发射 单发射与多发射工作方式比较 返回 上一张 指令存储器 寄存器 取指令 指令译码 指令执行 写回结果 存取数部件 浮点加法流水线 乘除法流水线 定点算逻部件 WR ID IF FA1 FA2 FA3 MD1 MD2 MD3 AL LS (a)单发射指令流水线 ID1 IF1 存取数部件 FA1 FA2 FA3 MD1 MD2 MD3 浮点加法流水线 乘除法流水线 定点算逻部件 WR1 WR2 ID2 IF2 指令存储器 取指令 指令译码 指令执行 写回结果 寄存器 寄存器 AL LS (b)多发射指令流水线 在超标量处理机中同样面临着预测分析和处理指令之间的功能部件冲突、数据相关和控制相关问题。主要采用的技术有一下几种: (1)寄存器重命名技术。 (2)先行指令窗口技术。 (3)转移预测技术。 (4)通过Tomasulo算法实现动态存储器地址的二义性消除。 (5)设置多个交叉开关,通过控制开关通路,把几个指令译码器的输出分别送到多个操作部件中去执行。 (6)要是指令流水线在一个周期内同时发射更多的指令,存储器就需要在一个周期为指令流水线提供多条指令。 4.4.2多发射的动态调度 1.多流水线调度 2.资源冲突 在标量处理机中,有多条指令流水线在同时工作,设置有多个能独立工作的操作部件,因此,必须解决多流水线的调度问题和操作部件的资源冲突问题。 1.多流水线调度 在有多条流水线同时工作时,指令的发射顺序和完成顺序对提高超标量处理机的性能非常重要。 如果指令的发射顺序是按照程序中的指令排列顺序进行的,称为顺序发射(in-order issue),否则,称为乱序发射(out—order issue)。 如果指令的完成顺序必须按照程序中的指令排列顺序进行,称为顺序完成(in-order completion),否则,称为乱序完成(out—order completion)。 通过一个具体的程序例子来介绍这三种方法。 I1: LOAD R1, A; I2: FADD R2, R1; I3: FMUL R3, R4; I4: FADD R4, R5; I5: FDEC R6; I6: FMUL R6, R7; (1)顺序发射顺序完成 输入指令

文档评论(0)

cduutang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档