第5章李学干_计算机系统结构.ppt

  1. 1、本文档共84页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章李学干_计算机系统结构.ppt

如果线性流水线各段经过的时间Δti不等,其中瓶颈段的时间为Δtj,则完成n个任务所能达到的实际吞吐率 其加速比 2. 效率 流水线的效率是指流水线中的设备实际使用时间占整个运行时间之比,也称流水线设备的时间利用率。由于流水线存在有建立时间和排空时间(最后一个任务流入到流出的时间),在连续完成n个任务的时间里,各段并不总是满负荷工作的。 如果是线性流水线,且各段经过时间相同,如图5.23那样, 则在T时间里,流水线各段的效率都相同,均为η0,即 整个流水线的效率 式中,分母m·T是时—空图中m个段和流水总时间T所围成的总面积,分子m·nΔt0则是时—空图中n个任务实际占用的总面积。因此,从时—空图上看,效率实际上就是n个任务占用的时—空区面积和m个段总的时—空区面积之比。显然,与吞吐率类似,只有当nm时,η才趋近于1。 同时还可看出,对于线性流水且每段经过时间相等时, 流水线的效率是正比于吞吐率的, 即 如果流水线各段经过的时间不等,各段的效率就会不等,但是,参照图5.23,不难得出整个流水线的效率 图 5.23 流水线工作举例 3. 流水线工作举例 5.2.3 流水机器的相关处理和控制机构 1. 局部性相关的处理 图 5.25 顺序流动和异步流动 图5.26 IBM 360/91的浮点执行部件结构框图 浮点操作站FLOS(Floating Point Operand Stack)缓冲的浮点操作命令的格式为 操作 源1 (目的), 源2 操作可以是浮点加、减、乘、除。源1指明存放源操作数的浮点寄存器FLR的号,并兼作存放中间结果的目的寄存器的号。 源2指明存放经存贮器总线送来的浮点操作数的缓冲器FLB的号。 它们分别经FLR总线和FLB总线将数据送入浮点加法流水线或浮点乘/除法流水线输入端的保存站。浮点加法器流水线的输入端设有3个保存站A1至A3,浮点乘/除法器流水线的输入端设有两个保存站M1和M2,分别用规定的站号标记。保存站由控制部分控制,只要任意一个保存站的两个源操作数都到齐,且流水段空闲时就可以进入流水线向前流动,因此是采用异步流动方式工作的。 由于操作命令中源1兼作目的,因此同时进入两条流水线的操作命令之间发生操作数相关的概率是较高的。设k+i表示k之后同时在两条流水线流动的第i条指令,则只要k+i 的源1与k的目的一样,就会发生“先写后读”相关,k+i的目的与k的目的一样,就会发生“写—写”相关, k+i的目的与k的源1一样,就会发生“先读后写”相关。也就是说,只要同时进入流水线的各个操作命令中使用了同一个浮点寄存器FLR的号就会发生相关。 现在,以FLOS依次送出 ADD F2, FLB1; (F2)+(FLB1)→F2 MD F2, FLB2; (F2)*(FLB2)→F2 两条操作命令为例,来说明是怎样判出发生相关以及怎样控制推后和相关直接通路的联接的。很明显,这两条命令异步流动时,“先写后读”、“写—写”、“先读后写”三种相关都会发生。  当FLOS送出 ADD F2, FLB1 操作命令时,它控制由FLR取得(F2),由FLB取得(FLB1)送往加法器保存站,例如送往A1,同时立即将F2的“忙位”置“1”, 以指明该寄存器的内容已送往保存站等待运算,这样F2的内容再不能被其他操作命令作源操作数读出用。由于F2这时已成为“目的”寄存器,准备接收由加法器来的运算结果,因此将F2的“站号”字段置成是A1的站号“1010” ,以便控制把站号为1010的保存站A1在加法流水线流出的运算结果经CDB总线送回F2。一旦结果送回后,立即将F2的“忙位”和“站号”都置成“0”,以释放出F2为别的操作命令使用。 问题在于,当F2的“忙位”为“1”,而加法结果并未流出加法流水线时,FLOS又送出操作命令 MD F2, FLB2 由译码控制去访问F2取源1操作数时,由于其“忙位”为“1”, 表明出现了F2相关,此时就不能直接将(F2)送往乘法器保存站, 而改成为把原存在F2的“站号”字段中的站号A1(即1010, 指明F2应有内容的来源)送往M1的“源1站号”,并把F2内的站号由A1(1010)改为M1(1000)以指明应改为从M1接收运算结果。 2. 全局性相关的处理 1) 猜测法 图 5.27 用猜测法处理条件转移 2) 加快和提前形成条件码 3) 采取延迟转移 4) 加快短循环程序的处理 3.

文档评论(0)

ziyouzizai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档