广工计算机系统结构课件第五章.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * k段k倍速 * * * * * 数列7+1+7+... * 数列7+1+7+... * * * * * * * * * * * * * * * * 3 最大指令级并行度 一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是有限的确定值 主要由程序自身的语义来决定,与这个程序运行在哪一种处理机上无关 对一个特定的程序,三条曲线最终都要收拢到同一个点上 不同程序,收拢点的位置不同 冯·诺依曼计算机---指令驱动---存储程序、顺序执行 数据相关、条件转移不可避免 影响了计组、系统结构、汇编、编译... * ? 1 多核与本章的哪部分技术接近?有何根本性不同? 2 超线程呢? 24p342 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 每个Dt吐1个任务 * 1 顺序发射顺序完成 6条指令按顺序分3个时钟周期发射 6条指令共用10个时钟周期完成 除了流水线的装入和排空部分之外, 还有8个空闲的时钟周期 I3慢I21T, I5慢I41T,对齐回原来的WRi I2I1写后读 I3慢I21T FA1资源冲突 I5慢I41T I6I5 R6写后写 I6I5写后读 * 2 顺序发射乱序完成 顺序发射顺序完成对齐写的空位去掉 I2I1写后读 FA1资源冲突 I6I5写后读 * 2 顺序发射乱序完成 比顺序发射顺序完成调度方法少5个空闲时钟周期 6条指令总的执行时间为9个时钟周期 比顺序发射顺序完成调度方法节省1个时钟周期 * 3 乱序发射乱序完成 采用乱序发射的指令调度方法,必须使用先行指令窗口 采用乱序发射,指令的完成次序必然也是乱序的 I2I1写后读I2推迟至第2次发射 I6I5写后读I6推迟至第3次发射 * 3 乱序发射乱序完成 除装入和排空外,已没有空闲周期,功能部件得到充分利用 6条指令总的执行时间缩短为8个周期 比顺序发射顺序完成方法节省2个周期 比顺序发射乱序完成方法节省1个周期 * 5.5.4 资源冲突 操作部件采用流水线结构,发生资源冲突的可能性很小 如果不采用流水线结构,发生资源冲突的可能性就大 下面是一个由4条指令程序的程序 I1:FADD R0, R1 ;R0←(R0)+(R1) I2:FMUL R2, R3 ;R2←(R2)×(R3) I3:FADD R4, R5 ;R4←(R4)+(R5) I4:FMUL R6, R7 ;R6←(R6)×(R7) 有5个空闲周期,4条指令需11个周期 23p330 * 5.5.1.4 资源冲突 4条指令共用8个周期 与没有采用流水线的方法相比,少用3个周期 * 在超标量处理机中,操作部件需要采用流水线结构 每个周期发射m条指令,操作部件的延迟时间为k个周期 部件不采用流水线结构,则使用同一个操作部件的两条指令的序号应该至少相差m×k 操作部件采用k个功能段的流水线结构,则使用同一个操作部件的两条指令的序号只需要相差m或m以上 超标量处理机中,指令流水线的段数一般在4至10之间,每个时钟周期发射的指令条数m在2至4之间;取中间值,k=7,m=3。若不发生资源冲突 操作部件不采用流水线结构,两条使用同一个功能部件的指令序号必须相差21或21以上 操作部件采用流水线结构,两条使用同一个功能部件的指令序号只需要相差3或3以上 超标量处理机中,操作部件一般要采用流水线结构 如果由于某种原因,操作部件不能采用流水线结构,则必须设置多个相同种类的操作部件 * 在超标量处理机中,操作部件需要采用流水线结构 普通标量处理机,希望相同操作连续出现 只有连续出现相同操作的指令序列时,流水线才能不“断流”,功能部件的效率才能得到充分发挥 超标量处理机则正好相反,希望相同操作不要连续出现 相同操作的指令序列连续出现时,会发生资源冲突 要求相同操作的指令能够相对均匀地分布在程序中 超标量处理机的这种要求正好符合一般标量程序的特点 * 5.5.5 超标量处理机性能 指令级并行度 (每次发射指令条数,每个时钟周期发射次数) 同时性并行,并发性并行 单流水线普通标量处理机的指令级并行度记作(1,1) 超标量处理机的指令级并行度记作(m,1) 超流水线处理机的指令级并行度记作(1,n) 超标量超流水线处理机的指令级并行度记作(m,n) 机器类型 k段流水线 基准标量处理机 m度 超标量 n度 超流水线 (m,n)度 超标量 超流水 机器流水线周期 1个时钟周期 1 1/n 1/n 同时发射指令条数 1条 m 1 m 指令发射等

文档评论(0)

4477704 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档