《计算机系统结构》电子教案(课3).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《计算机系统结构》电子教案(课3)

2014.2.17 计算机系统结构 第3章 基本流水线技术(Pipeline,P53) (指令级,顺序执行) 3.1 流水线的概念 流水线工作时空图(P54) 3.1.2 流水技术的分类(P55) 3.2 流水线性能指标计算(P58) “瓶颈”问题及其解决方法(P59) 对“设备重复”的分析 3.2.2 加速比(即吞吐率之比) 3.2.3 效率(设备利用率) 例3.1(P62) 例3.3(张晨曦2版P85例3.2) 例3.4(张晨曦2版P85例3.3) 作业3(第3次课) *   本章学习处理机在执行指令过程中使用的流水加速技术。主要内容有流水技术的分类、MIPS流水线、性能指标计算、相关等。   不含向量指令的计算机称为标量计算机,含有向量指令的计算机称为向量计算机。本章学习标量流水线,第4章学习向量流水线。   标量计算机的流水技术属于指令级并行技术,向量计算机同时使用指令级、操作级并行技术。   流水处理方式的特征,是让多个依次启动的任务,同时使用系统的不同部件,通过时间重叠来提高处理速率。这种技术理论上不增加成本。   每条指令的处理过程,可以划分为取指、译码、取数、运算、送结果5个子过程,也可以分得更细或更粗一些。划分的原则是各部分时间长度大致相等、并使用CPU中不同的部件,这样才有利于多个子过程重叠处理。   CPU中的各个部件按流水处理顺序连接起来,就称为一条流水线。 3.1.1 流水线工作原理   处理机解释程序的方式有顺序方式、流水方式等。 顺序方式是解释完一条指令再开始解释下一条; 流水方式是把一个重复的过程分解为若干个子过程,每个子过程可以与其它子过程同时进行,以此提高单位时间内解释指令的数目。   下图是流水线结构图(P54) 线性/非线性: 部件级/处理机级/处理机间级(宏流水线) : 单功能/多功能: 静态/动态: 标量/向量: 同步/异步: 顺序/乱序: 主整数单元(load、store、整数ALU、分支) 浮点与整数乘法器 浮点加法器(浮点加、减、转换) 浮点与整数除法器 图3.3 MIPS的4条单功能流水线 M0 A0 DIV(非流水,24Δt) EX IF ID MEM WB M1 M2 M3 M4 M5 M6 A1 A2 A3 演示程序: DMUL R1,R2,R3 DMUL R4,R5,R6 SUB.D F1,F2,F3 SUB.D F4,F5,F6 LD R1,0(R0) 3.2.1 吞吐率TP (1) 实际吞吐率(TP ─── ThroughPut)指流水线在单位时间内执行的任务数,可以用输入任务数或输出任务数表示。 其中n是任务数, 是流水方式下总时间。   当满足 条件时,有 ,其中k是段数。 (2) 最大吞吐率TPmax是n→∞情况下,只考虑流水线“满载”运行期间在单位时间内执行的任务数。 (1)瓶颈:瓶颈就是Δti最大的段,它使流水线“流速”减慢(P59第3行)。 S1 S2 S3 S4 Δt 3Δt Δt Δt (2)方法1:细分 ─── 将瓶颈设备再细分为下一级流水线(P59)。 S1 S2a S2b S2c S3 S4 Δt Δt Δt Δt Δt Δt (3)方法2:设备重复 ─── 将瓶颈设备重复设置多套,轮番接受任务)。 S2a 3Δt S1 S2b S3 S4 Δt 3Δt Δt Δt S2c 注意两种方法的时空图不同。 3Δt   “设备重复”方法对“瓶颈”段的投入与产出倍数相同,局部性能/价格比没有改善(本例局部变化率为3/3=1),但是整条流水线的性能也提高了相同的倍数,所以性能/价格比就提高了(本例全局变化率为3/1.5=2)。这也是Amdahl定律(加快最费时间的事件)的一个具体应用。 其中 To 是顺序方式下总时间(Told), 段效率: , 各段平均效率: 其中 表示第i段设备量占整条流水线全部设备量的百分比。 当满足 条件(即“等长”、“等权”)时,有: 上式指出,S=E×k,就是说当效率达到100%时,流水方式(每个Δt完成一个任务)吞吐率为顺序方式(每k个Δt完成一个任务)的k倍。 分析:已知下列表达式,静态二功能,有切换,有相关,k = 8,n = 7。要求用最少切换、最少相关算法。 Z = (A1+B1)?(A2+B2)?(A3+B3)?(A4+B4) 加法: ① ② ③ ④ 乘法: ⑤ ⑥ 乘法: ⑦ 时空图见教材图3.11,算式见P62倒数第3行。 例3.2(P62) (自学) 已知:一条流水线,CY

文档评论(0)

189****6821 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档