- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chapter4_3_2010101的914548896
动态调度 (Cont), 推断执行和ILP;Review Tomasulo;为什么顺序发射?;关于异常处理???;进行循环重叠执行需要尽快解决分支问题!;控制相关的动态解决技术;分支对性能的影响;条件转移指令对流水线性能的影响;Dynamic Branch Prediction;1-bit BHT;解决办法: 2位记录分支历史
Red: stop, not taken
Green: go, taken;;;BHT Accuracy;Correlating Branch Predicator ;Correlating Branches;两级预测器基本工作原理;;Correlating Branches;;Correlating Branches;;分支指令的地址作为BTB的索引,以得到分支预测地址
必须检测分支指令的地址是否匹配,以免用错误的分支地址
从表中得到预测地址
分支方向确定后,更新预测的PC;Accuracy of Different Schemes;HW support for More ILP;Review – 控制相关的动态解决技术 ;需要硬件缓存没有提交的指令结果: reorder buffer (ROB)
3 个域: 指令类型,目的地址, 值
Reorder buffer 可以作为操作数源 = 就像有更多的寄存器(与RS类似)
当程序执行阶段完成后,用ROB的编号代替RS中的值
增加指令提交阶段
ROB提供执行完成阶段和提交阶段的操作数
一旦操作数提交,结果就写入寄存器
这样,在预测失败时,容易恢复推断执行的指令,或发生异常时,容易恢复状态;1. Issue—get instruction from FP Op Queue
如果RS和ROB有空闲单元就发射指令。如果寄存器或ROB中源操作数可用,就将其发送到RS,目的地址的ROB编号也发送给RS (this stage sometimes called “dispatch”)
2. Execution—operate on operands (EX)
当操作数就绪后,开始执行。如果没有就绪,监测CDB,检查RAW相关
3. Write result—finish execution (WB)
将运算结果通过CDB传送给所有等待结果的FU以及ROB单元,标识RS可用
4. Commit—update register with reorder result
按ROB表中顺序,如果结果已有,就更新寄存器(或存储器),并将该指令从ROB表中删除
预测失败或有中断时,刷新ROB;;;;;;;;;;;;;;;;;;;;;;消除存储器的二义性 : 处理对存储器引用的RAW相关;需要缓冲区以程序序保存所有对存储器的写操作
保存地址(地址可用时)和值(值可用时)
FIFO ordering: 以程序序确认和删除store
当发射一个load操作时,记录当前store队列的头指针.
当load的地址可用时,检查store队???:
如果store队列存在正等待该地址的store操作,则stall该load操作
如果load地址与前面的store地址匹配,则有 memory-induced RAW hazard:
存储的值可用 ? 返回值
存储的值还没有准备好 ? 返回源指令的ROB编号
否则发出存储器请求
由于实际的store操作顺序提交,所以不会有 WAR/WAW 相关.
;;;Integer: 18 - 60; Change from Infinite window to examine to 2000 and maximum issue of 64 instructions per clock cycle; Change 2000 instr window, 64 instr issue, 8K 2 level Prediction; Change 2000 instr window, 64 instr issue, 8K 2 level Prediction, 256 renaming registers; Perfect disambiguation (HW), 1K Selective Prediction, 16 entry return, 64 registers, issue as many as window;小结#1/2;动态调度方案可以用硬件动态完成循环展开
通过重命名机制来消除WAR和 WAW 相关
Reorder Buffer:
提供了撤销指令运行的机制
指令以发射序存放在ROB中
指令顺序提交
分支预测对提高性能是非常重要的
推断执行是利用了ROB撤销指令执行的机制
Superscalar 和VLIW: CPI 1 (IPC 1)
您可能关注的文档
- Brugada综合征4的.ppt
- BT软件安装教程的.doc
- BuildCraft说明书的.pdf
- Bxzdeo建筑经济与企的业管理全国2007年10月高等教育自学考试(附答案)文库.doc
- B超的基本原理与性牡能指标 PPT课件.ppt
- C 油脂精炼-脱酸的.ppt
- C++中类和对象的.ppt
- Bugzilla简明使用手的则.doc
- C++作业题及答案的.doc
- C++数据结构实训报傅逆书.doc
- 浙江省宁波市九校2021-2022学年高一上学期语文期末联考(参考答案).docx
- 浙江省嘉兴市《公共基本能力测验(专技岗)》事业单位考试真题.docx
- 浙江省嘉兴市五校2025届高考语文必刷试卷含解析.docx
- 浙江省丽水市莲都区社区专职工作者招聘《综合应用能力》试题和解析.docx
- 2025年自我管理主题班会初中.pptx
- 浙江省一级重点中学(六校)2022届高三第一次联考语文文(附答案.docx
- 浙江省2022年高考语文仿真模拟试卷22 文.docx
- 浙江省丽水市《行测》公务员(国考)招聘考试真题及答案.docx
- 浙江省2022中考语文模拟卷(word版含答案).docx
- 高新区电容器产业园项目运营方案.pptx
文档评论(0)