网站大量收购独家精品文档,联系QQ:2885784924

Branch Predication的.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Branch Predication的

4.3 控制相关的动态解决技术 ;本节着重于: 通过硬件技术,动态地进行分支处理,对程序运行时的分支行为进行预测,提前对分支操作做出反应,加快分支处理的速度。 分支的最终延迟取决于流水线的结构、预测的方法和预测错误后恢复所采取的策略。 ;4.3.1 分支预测缓冲 ;分支预测缓冲技术(Branch-Prediction Buffer或者Branch History Table,简写为BTB或者BHT): 目前广泛使用的最简单的动态分支预测技术。 使用一片存储区域,记录最近一次或几次分支特征的历史。 ;状态转换图 ;2. 分支预测缓冲技术包括两个步骤 ;图4.10 分支预测执行不成功和重新执行过程 ;例4.6 一个循环共循环10次,它将分支成功9次, 1次不成功。假设此分支的预测位始终在缓冲区中。那么分支预测的准确性是多少? 解 这种固定的预测将会在第一次和最后一次 循环中出现预测错误。 第一次预测错误是源于上次程序的执行, 因为上一次程序最后一次分支是不成功的。 最后一次预测错误是不可避免的,因为前 面的分支总是成功,共九次。 因此,尽管分支成功的比例率是90%, 但分支预测的准确性为80%(两次不正确, 8次确)。 ;4.1位预测机制的缺点 只要预测出错,往往是连续两次而不是一次。 5.解决方法 采用两个预测位的预测机制。 在两个预测位的分支预测中,更改对分支的 预测必须有两次连续预测错误。 两位分支预测的状态转换图 ;图4.11 具有两个分支预测位的分支预测缓冲状态转换机制 ;6. n位分支预测缓冲 采用n位计数器,则计数器的值在0到2n-1之间: 当计数器的值大于或等于最大值的一半(2n-1) 时,则预测下一次分支成功; 否则预测下一次分支不成功。 预测位的修改和两位预测时相同: 当分支成功时计数器的值加1,不成功时减1。 研究表明: n位分支预测的性能和两位分支预测差不多, 因而大多数处理器都只采用两位分支预测。 ;7.对于真实的应用程序,两位的分支预测的准 确率可达到多少呢? SPEC89标准程序的测试: 在使用4096个记录项的缓冲区时,分支 预测准确率可达到99%到82%。 使用无穷多历史记录项的分支预测缓冲, 只有少量程序的分支预测准确率仅仅比4096 个记录项提高1%,多数程序的预测精度是相 同的。 因此,对于SPEC89应用环境而言,4K的 缓冲区是恰当的。 8.上述分支预测机制对于改进后的DLX流水线没 有帮助。 ;4.3.2 分支目标缓冲 ;1. 分支目标缓冲结构和工作过程 ;2. 在流水线的各个阶段中,具有分支目标缓冲的工作 分配如图4.13。 ;3. 采用BTB技术时指令在各种情况下的延迟 ;例4.7 按表4.3计算分支转移总的延迟,根据下面的假 设,计算分支目标缓冲的性能。 (1)对于BTB中的指令,预测准确率90% (2)缓冲区命中率90% (3)不在BTB中分支转移成功的比例为60% ; BTB命中率 ? 预测错误率 ? 2 = 90% ? 10% ? 2 = 0.18(时钟周期) (3)不在BTB中,实际成功,此时的延迟为: (1-BTB命中率) ? 不在BTB中分支转移成功率 ? 2 = 10% ? 60% ? 2 = 0.12(时钟周期) (4)不在BTB中,实际不成功,此时的延迟为0。;4. 对分支预测机制的一种改进 在缓冲区中不仅存入目的地址,而且还存入一 个或多个目标指令。 有两种潜在的好处: ;4.3.3 基于硬件的前瞻执行 ; (2)在控制相关消除之前指令前瞻执行; (3)对基本块采用动态调度。 2.基于硬件的前瞻是动态地根据数据相关性来选择 指令和指令的执行时间。 实质:数据流驱动运行(data-flow execution) 只要操作数有效,指令就可以执行。 3.指令的确认 前瞻执行的指令产生的结果要一直到指令处 于非前瞻执行状态时,才能确定为最终结果,才 允许最终写到寄存器或存储器中去。 ;4.实现前瞻的关键思想: 允许指令乱序执行,但必须顺序确认。 5.再定序缓冲(reorder buffer,简记为ROB) 保存那些执行完毕但未经确认的指令及其结 果。在指令执行完毕和确认之间这段时间里,由 再

文档评论(0)

ayangjiayu3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档