网站大量收购独家精品文档,联系QQ:2885784924

chapter4_3_2010101的914548896.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chapter4_3_2010101的914548896

动态调度 (Cont), 推断执行和ILP;Review Tomasulo;为什么顺序发射?;关于异常处理???;进行循环重叠执行需要尽快解决分支问题!;控制相关的动态解决技术;分支对性能的影响;条件转移指令对流水线性能的影响;Dynamic Branch Prediction;1-bit BHT;解决办法: 2位记录分支历史 Red: stop, not taken Green: go, taken;;;BHT Accuracy;Correlating Branch Predicator ;Correlating Branches;两级预测器基本工作原理;;Correlating Branches;;Correlating Branches;;分支指令的地址作为BTB的索引,以得到分支预测地址 必须检测分支指令的地址是否匹配,以免用错误的分支地址 从表中得到预测地址 分支方向确定后,更新预测的PC;Accuracy of Different Schemes;HW support for More ILP;Review – 控制相关的动态解决技术 ;需要硬件缓存没有提交的指令结果: reorder buffer (ROB) 3 个域: 指令类型,目的地址, 值 Reorder buffer 可以作为操作数源 = 就像有更多的寄存器(与RS类似) 当程序执行阶段完成后,用ROB的编号代替RS中的值 增加指令提交阶段 ROB提供执行完成阶段和提交阶段的操作数 一旦操作数提交,结果就写入寄存器 这样,在预测失败时,容易恢复推断执行的指令,或发生异常时,容易恢复状态;1. Issue—get instruction from FP Op Queue 如果RS和ROB有空闲单元就发射指令。如果寄存器或ROB中源操作数可用,就将其发送到RS,目的地址的ROB编号也发送给RS (this stage sometimes called “dispatch”) 2. Execution—operate on operands (EX) 当操作数就绪后,开始执行。如果没有就绪,监测CDB,检查RAW相关 3. Write result—finish execution (WB) 将运算结果通过CDB传送给所有等待结果的FU以及ROB单元,标识RS可用 4. Commit—update register with reorder result 按ROB表中顺序,如果结果已有,就更新寄存器(或存储器),并将该指令从ROB表中删除 预测失败或有中断时,刷新ROB;;;;;;;;;;;;;;;;;;;;;;消除存储器的二义性 : 处理对存储器引用的RAW相关;需要缓冲区以程序序保存所有对存储器的写操作 保存地址(地址可用时)和值(值可用时) FIFO ordering: 以程序序确认和删除store 当发射一个load操作时,记录当前store队列的头指针. 当load的地址可用时,检查store队???: 如果store队列存在正等待该地址的store操作,则stall该load操作 如果load地址与前面的store地址匹配,则有 memory-induced RAW hazard: 存储的值可用 ? 返回值 存储的值还没有准备好 ? 返回源指令的ROB编号 否则发出存储器请求 由于实际的store操作顺序提交,所以不会有 WAR/WAW 相关. ;;;Integer: 18 - 60; Change from Infinite window to examine to 2000 and maximum issue of 64 instructions per clock cycle; Change 2000 instr window, 64 instr issue, 8K 2 level Prediction; Change 2000 instr window, 64 instr issue, 8K 2 level Prediction, 256 renaming registers; Perfect disambiguation (HW), 1K Selective Prediction, 16 entry return, 64 registers, issue as many as window;小结#1/2;动态调度方案可以用硬件动态完成循环展开 通过重命名机制来消除WAR和 WAW 相关 Reorder Buffer: 提供了撤销指令运行的机制 指令以发射序存放在ROB中 指令顺序提交 分支预测对提高性能是非常重要的 推断执行是利用了ROB撤销指令执行的机制 Superscalar 和VLIW: CPI 1 (IPC 1)

文档评论(0)

ayangjiayu3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档