流水线技术--流水线中的相关.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.3 流水线中的相关;◆ 数据相关 当一条指令需要用到前面某条指令的结 果,从而不能重叠执行时,就发生了数据相 关。 ◆ 控制相关 当流水线遇到分支指令和其他能够改变 PC值的指令时,就会发生控制相关。;在本章中,我们约定:;3.3.1 流水线中的结构相关;4. 结构相关举例:访存冲突;虚拟存储器的特点;虚拟存储器的特点;引入暂停后的时空图;5. 避免结构相关:;3.3.2 流水线的数据相关;虚拟存储器的特点;2. 利用定向技术减少数据相关引起的暂停 (1) 定向技术的主要思路:在发生上述 数据相关时,后面的指令并不是马 上就要用到前一条指令的计算结果。 如果能够将计算结果从其产生的地 方直接送到需要它的地方,就可以 避免暂停。 (2) 采用定向技术消除上例中的相关 工作过程演示 ;虚拟存储器的特点;虚拟存储器的特点;(3) 当定向硬件检测到前面某条指令的结果寄存 器就是当前指令的源寄存器时,控制逻辑会 将前面那条指令的结果直接从其产生的地方 定向到当前指令所需的位置。 (4) 一个功能单元的输出不仅可以定向到其自身 的输入,而且还可以定向到其它单元的输入。 举例;3.3 流水线中的相关;(5) 在DLX中,任何流水寄存器到任何功能单元的 输入都可能需要定向路径。;虚拟存储器的特点;(2) 写后写相关 (WAW) 在 i 写入之前,j 先写。 最后写入的结果是 i 的,错误!;② DLX整数流水线中不会发生这种相关 (仅在WB段进行写操作);(3) 读后写相关 (WAR);(1) 并非所有的数据相关都可以用定向技术解决 举例 ;(2) 增加流水线互锁硬件,插入“暂停”。 当互锁硬件发现这种相关时,就 暂停流水线,直到相关消失。 举例:演示A 演示B ;3.3 流水线中的相关;例3.5 假设某指令序列中20%的指令是Load指令,并且紧跟在Load指令之后的半数指令需要使用到载入的结果,如果这种数据相关将产生一个时钟周期的延迟。理想流水线(没有任何延迟,CPI为1)的指令执行速度要比这种真实流水??的快多少? 解:我们可以利用CPI作为衡量标准。对于真实的流水线而言,由于Load指令之后的半数指令需要暂停,所以这些被暂停指令的CPI是2。又知Load指令占全部指令的20%,所以真实流水线的实际CPI为:(0.9×1+0.1×2)=1.1,这表示理想流水线的指令执行速度是其执行速度的1.1倍。 ;5.对数据相关的编译调度方法 ;A=B+C的代码会导致暂停;(3) 举例: 例3.6 请为下列表达式生成没有暂停的DLX 指令序列:  a=b+c ;  d=e-f ; 假设载入延迟为1个时钟周期。 题解 ;(1) 指令发射(issue):指令从译码段(ID)进入 执行段(EX)。 相应的指令称为已发射的指令。 (2) DLX整数流水线中,可以在ID段检测所有的 数据相关; 若数据相关,则在指令流出前,让其暂停。 (3) 可以在ID段确定需要什么样的定向,并设置 相应的控制; 这样能减少硬件复杂度(因为不必挂起已 改变了机器状态的指令)。;(4) 也可以在需要用到操作数的那个时钟周期检测 相关或定向; (5) 举例说明: ◆ 由Load指令引起的RAW相关的互锁(简称Load 互锁)可以通过ID段的检测来实现; ◆ 到ALU输入的定向可以在EX段实现。 Load互锁 ◆ 流水线相关硬件可以检测到的各种相关情况 可以看出,仅需把Load指令的目的寄存 器地址与Load指令后的两条指令的源寄存器 地址进行比较。; ◆ 在ID段检测是否需要启动Load互锁需要进行 三种比较;◆ 当检测到相关后,控制部件必须在流水线中 插入暂停周期,并使IF和ID段中的指令停止 前进。;◆ 所有的定向发生在: ALU或DM输出 → ALU输入,DM输入, “O”检测部件 (图示);3.3.3 流水线的控制相关; 在DLX流水线中,分支转移成功导致暂停3个 时钟周期。   若分支指令的频度为30%,

文档评论(0)

浪漫唯美-文档菜鸟 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档