计算机组成原理与系统结构 教学课件 作者 马礼 第9章 流水线处理机及设计.ppt

计算机组成原理与系统结构 教学课件 作者 马礼 第9章 流水线处理机及设计.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? 第9章 流水线处理机及 设计 本章主要内容 本章讲述以时间重叠为主来提高计算机系统并行处理能力的流水线处理机。首先,叙述流水处理的基本原理、流水线的分类和流水线处理机的主要性能。其后,讨论影响流水性能的各种相关处理和流水线的调度问题。最后,简要讲述有关指令级高度并行的超标量、超长指令字、超流水线处理机的概念。重点要求掌握流水线处理机的基本原理和流水线的性能分析。 9.1 先行控制技术 9.2 流水线工作原理 9.3 流水线性能分析 9.4 其他结构的高性能处理机 9.1 先行控制技术 9.1.1 重叠控制与先行控制 9.1.2 先行控制方式中处理机的结构 9.1.3 先行控制方式中缓冲深度的设计 1、先行指令缓冲栈从全满到全空,即分析指令的速度比取指令的速度快。 2、先行指令缓冲栈从全空到全满,即分析指令的速度比取指令的速度慢。 其它缓冲栈的深度也是用类似的方法求出。但在整个先行控制器中,各缓冲栈的缓冲深度应协调。 9.1.4 数据相关 9.1.5 控制相关 1.猜测法 2.采用延迟转移 3.加快短循环程序的处理 4.设置两个先行指令缓冲栈 9.2 流水线工作原理 9.2.1 流水线的工作原理及定义 9.2.2 流水线的分类 1.按流水处理的级别分类 功能部件级、处理机级和系统级等多种类型。 2.按功能分类 流水线按功能可以分为单功能流水线和多功能流水线。 3.按流水线不同功能的联接切换方式分类 按多功能流水线的各段能否允许同时用于多种不同功能联接,可把流水线分为静态流水线和动态流水线。 4.按流水线的结构分类 从流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线性流水线。 9.3 流水线性能分析 衡量处理机性能的指标主要是吞吐率(thoughput rate,TP)、加速比(speedup ratio)和效率(efficiency)。 9.3.1 线性流水线的性能分析 1.吞吐率 2.加速比 3.效率 如果各段执行时间相等,则各段的效率是相等的,都等于。即 (9-15) 则整个流水线的效率为: 9.3.3 非线性流水线的调度技术简介 为了避免流水线发生冲突,一般采用延迟输入新任务的方法。那么,在非线性流水线的输入端,究竟每隔多少个时钟周期向流水线输入一个新任务才能使流水线的各个功能段都不发生冲突,这就是非线性流水线的调度问题。通常,在一般情况下,这个间隔的时钟周期数应该越小越好。因此,非线性流水线调度的任务是要找到一个最小的循环周期。 9.4 其他结构的高性能处理机 9.4.1 超标量处理机 超标量流水机则采用多指令流水线,每个同时流出m条指令(称度为m)。 9.4.2 超流水线处理机 超流水线处理机不同于超标量处理机,每个△t/仍只流出一条指令,但它的△t/值小,一台度为m的超流水线处理机的△t/只是基本机器周期△t的1/m。因此,一条指令需花km△t/的时间,k为一条指令所含的基本机器周期数。只要 流水线性能得以充分发挥,其并行度就可达m。 9.4.3 超标量超流水线处理机 超标量超流水线处理机就是将超标量技术和超流水线技术结合到一起,从而进一步提高处理机的指令级并行度。 9.4.4 超长指令字技术 超长指令字采用多个独立的功能部件,但它并不是将多条指令流出到各个功能单元,而是将多条指令的操作打包,形成一条非常长的指令,超长指令字由此得名。选择同时可流出的多条指令的任务由编译器完成,而在超标量机器中此功能是由硬件完成的,所以超长指令字机器可以节省大量硬件。 * * 图9-1 无重叠执行方式 图9-2 一次重叠执行方式 图9-3 二次重叠执行方式 图9-4 先行控制方式中的一次重叠执行方式 图9-5 分析与执行时间不等的一次重叠执行方式 图9-6 先行控制方式 图9-7 采用先行控制方式的处理机结构 图9-8 重叠执行时第K条指令和第K+1条指令的关系 图9-10 指令解释的流水线处理 图9-11 指令解释流水处理的时(间)-空(间)图 图9-12 浮点加法器的四级流水线 图9-13 系统级流水线 TP= 图9-18 各段执行时间相等的流水线时空图 图9-21 任务数与加速比的关系

文档评论(0)

时间加速器 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档