并行计算机体系结构的第三章.ppt

  1. 1、本文档共215页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
并行计算机体系结构的第三章

以如下6条指令组成的程序为例,说明这三种调度方法(m=2) I1:LOAD R1, A ;R1←(A) I2:FADD R2, R1 ;R2←(R2)+(R1) I3:FMUL R3, R4 ;R3←(R3)×(R4) I4:FADD R4, R5 ;R4←(R4)+(R5) I5:DEC R6 ;R6←(R6)-1 I6:FMUL R6, R7 ;R6←(R6)×(R7) 6条指令中有4个数据相关,包括2个写读相关,1个读写相关和1个写写相关。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 1.顺序发射顺序完成 共用10个时钟周期完成 还有8个空闲的时钟周期 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 2.顺序发射乱序完成 总的执行时间为9个时钟周期, 节省了一个时钟周期。少了5个空闲时钟周期。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 3. 乱序发射乱序完成(采用先行指令窗口,度m=3) 没有空闲周期,功能部件得到充分利用。 总的执行时间为8个周期,节省2个周期。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 资源冲突 如果操作部件采用流水线结构,发生资源冲突的可能性很小; 如果不采用流水线结构,发生资源冲突的可能性就比较大。 下面是一个由4条指令的程序例子: I1:FADD R0, R1 ;R0←(R0)+(R1) I2:FMUL R2, R3 ;R2←(R2)×(R3) I3:FADD R4, R5 ;R4←(R4)+(R5) I4:FMUL R6, R7 ;R6←(R6)×(R7) Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 操作部件不采用流水线: 做完4条指令总共用了11个周期, 有5个空闲周期。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 操作部件采用流水线: 做完4条指令共用8个周期, 少用3个周期。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 操作部件采用流水线结构的原因分析 假设每个周期发射m条指令,操作部件的延迟时间为k个周期, 如果操作部件不采用流水线结构,则使用同一个操作部件的两条指令序号应该至少相差m×k 如果操作部件采用k段流水线结构,则使用同一个操作部件的两条指令只需相差m或m以上 操作部件的延迟时间k一般在4至10之间,每个时钟周期发射的指令条数m在2至4之间。取中间值,k=7,m=3 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 为了不发生资源冲突,如果操作部件不采用流水线结构, 两条使用同一个功能部件的指令序号必须相差21或21以上。 如果操作部件采用流水线结构, 两条使用同一个功能部件的指令序号只需要相差3或3以上。 因此,在超标量处理机

文档评论(0)

ayangjiayu4 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档