- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Branch Predication的
4.3 控制相关的动态解决技术 ;本节着重于:
通过硬件技术,动态地进行分支处理,对程序运行时的分支行为进行预测,提前对分支操作做出反应,加快分支处理的速度。
分支的最终延迟取决于流水线的结构、预测的方法和预测错误后恢复所采取的策略。
;4.3.1 分支预测缓冲 ;分支预测缓冲技术(Branch-Prediction Buffer或者Branch History Table,简写为BTB或者BHT): 目前广泛使用的最简单的动态分支预测技术。 使用一片存储区域,记录最近一次或几次分支特征的历史。 ;状态转换图 ;2. 分支预测缓冲技术包括两个步骤 ;图4.10 分支预测执行不成功和重新执行过程 ;例4.6 一个循环共循环10次,它将分支成功9次, 1次不成功。假设此分支的预测位始终在缓冲区中。那么分支预测的准确性是多少?
解 这种固定的预测将会在第一次和最后一次 循环中出现预测错误。
第一次预测错误是源于上次程序的执行, 因为上一次程序最后一次分支是不成功的。
最后一次预测错误是不可避免的,因为前 面的分支总是成功,共九次。
因此,尽管分支成功的比例率是90%, 但分支预测的准确性为80%(两次不正确, 8次确)。 ;4.1位预测机制的缺点
只要预测出错,往往是连续两次而不是一次。
5.解决方法 采用两个预测位的预测机制。
在两个预测位的分支预测中,更改对分支的预测必须有两次连续预测错误。
两位分支预测的状态转换图
;图4.11 具有两个分支预测位的分支预测缓冲状态转换机制 ;6. n位分支预测缓冲
采用n位计数器,则计数器的值在0到2n-1之间:
当计数器的值大于或等于最大值的一半(2n-1)时,则预测下一次分支成功;
否则预测下一次分支不成功。
预测位的修改和两位预测时相同:
当分支成功时计数器的值加1,不成功时减1。
研究表明: n位分支预测的性能和两位分支预测差不多,因而大多数处理器都只采用两位分支预测。
;7.对于真实的应用程序,两位的分支预测的准确率可达到多少呢?
SPEC89标准程序的测试:
在使用4096个记录项的缓冲区时,分支 预测准确率可达到99%到82%。
使用无穷多历史记录项的分支预测缓冲, 只有少量程序的分支预测准确率仅仅比4096 个记录项提高1%,多数程序的预测精度是相 同的。
因此,对于SPEC89应用环境而言,4K的 缓冲区是恰当的。
8.上述分支预测机制对于改进后的DLX流水线没有帮助。 ;4.3.2 分支目标缓冲 ;1. 分支目标缓冲结构和工作过程 ;2. 在流水线的各个阶段中,具有分支目标缓冲的工作 分配如图4.13。 ;3. 采用BTB技术时指令在各种情况下的延迟 ;例4.7 按表4.3计算分支转移总的延迟,根据下面的假 设,计算分支目标缓冲的性能。 (1)对于BTB中的指令,预测准确率90% (2)缓冲区命中率90% (3)不在BTB中分支转移成功的比例为60% ; BTB命中率 ? 预测错误率 ? 2
= 90% ? 10% ? 2
= 0.18(时钟周期)
(3)不在BTB中,实际成功,此时的延迟为:
(1-BTB命中率) ? 不在BTB中分支转移成功率 ? 2
= 10% ? 60% ? 2
= 0.12(时钟周期)
(4)不在BTB中,实际不成功,此时的延迟为0。;4. 对分支预测机制的一种改进 在缓冲区中不仅存入目的地址,而且还存入一 个或多个目标指令。 有两种潜在的好处: ;4.3.3 基于硬件的前瞻执行 ; (2)在控制相关消除之前指令前瞻执行;
(3)对基本块采用动态调度。
2.基于硬件的前瞻是动态地根据数据相关性来选择指令和指令的执行时间。
实质:数据流驱动运行(data-flow execution) 只要操作数有效,指令就可以执行。
3.指令的确认
前瞻执行的指令产生的结果要一直到指令处于非前瞻执行状态时,才能确定为最终结果,才允许最终写到寄存器或存储器中去。 ;4.实现前瞻的关键思想: 允许指令乱序执行,但必须顺序确认。
5.再定序缓冲(reorder buffer,简记为ROB) 保存那些执行完毕但未经确认的指令及其结果。在指令执行完毕和确认之间这段时间里,由
再
您可能关注的文档
- AL-7480大型总线制钡抹警主机说明书.pdf
- Allegro约束规则设值拿.doc
- AllExperiments__《的数学建模实验》上机实验作业.pdf
- Altium Designer Ge的rber CAD 导出方法.doc
- Altium Designer 中的制作PCB元件库.doc
- AM300通讯协议的.doc
- AMD全系列CPU的.doc
- AMD台式机和笔记本吹摩理器(CPU)型号大全.doc
- AMD和英特尔的区别实那什么?.doc
- AMD处理器的微架构(的6.30).doc
- 小学数学教学中的思维评价模式创新与实践教学研究课题报告.docx
- 2025年防潮防锈纸项目可行性研究报告.docx
- 高中化学实验设计与家乡特色美食制作工艺的关联教学研究课题报告.docx
- 小学生物实验中昆虫生态系统对生态平衡维持的重要性研究教学研究课题报告.docx
- 小学科学探究自然界中物质的变化规律与应用研究教学研究课题报告.docx
- 初中数学教学中数学竞赛训练软件的应用与数学思维拓展教学研究课题报告.docx
- 初中生特殊家庭心理危机干预的心理健康教育师资培训体系研究教学研究课题报告.docx
- 初中物理教学中概念学习的个体差异研究教学研究课题报告.docx
- 《高校公共艺术课程审美能力培养与艺术专业教育的融合研究》教学研究课题报告.docx
- 细胞因子制剂项目审查报告.docx
文档评论(0)