第3章 流水技术与流水处理机.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
解 (1)计算3条向量指令各自单独流水执行时所需时间。 向量指令V3←存储器 所需流水线建立的时间为启动存储器所需时钟周期数,即有s1=1;访存取向量A并打入向量寄存器V3中,以及流水操作打入A的第一个元素所需时钟周期数为6 + =7 ,即e1=7;完成向量A其余N-1个元素的打入所需时钟周期数为(N-1)。因此,该向量指令单独流水执行所需时间 向量指令V2←V0+V1单独流水执行所需时间 向量指令V4←V2*V3单独流水执行所需时间 因此,3条指令之间串行执行,共需时间 (2)由于指令①和指令②同时并行,所需时间 ,然后执行指令③,因此,共需时间 (3)由于指令①与指令②之间既无向量流水线资源冲突(前者使用访存流水线,后者使用向量加流水线,二者之间无资源冲突),又无向量寄存器的先写后读相关,因此,这2条指令是一个编队,可以同时并行执行。但是,指令③与指令①之间有寄存器V3的先写后读相关,与指令②之间有寄存器V2的先写后读相关,因此,指令③是另一个编队。可以在编队之间采用链接技术,即可把指令①和指令②同时并行的流水线流出的结果向量元素直接流入指令③的流水线。指令①流水线与指令②流水线同时并行执行,流出第一对元素的时间为 ,因此,共需时间 超标量超流水处理机相对于单发射处理机的加速比为 最大加速比为 3.5.4 超长指令字处理机的基本结构与特征 超长指令字(VLIW)处理机对指令序列的处理方式称为超长指令字处理方式。VLIW处理方式把一个足够长的指令分割成多个字段,每个字段都可以独立地控制各自的运算器、寄存器、互连网络(矩阵开关)和存储器等。 根据VLIW处理机的基本结构和目前推出的有代表性的VLIW处理机,VLIW处理方式具有下述主要特征。 (1)依靠编译组装超长指令 (2)硬件结构简单 (3)适合于细粒度的并行处理 (4)指令系统的非兼容性 3.5.5 多发射处理机的性能比较 表3.6 4种不同类型处理机的性能比较 机器类型 单发射处理机 超标量处理机 超流水处理机 超标量超流水处理机 流水线周期 1个时钟周期 1个时钟周期 1/n时钟周期 1/n时钟周期 同时发射指令条数 1条 m条 1条 m条 指令发射等待时间 1个时钟周期 1个时钟周期 1/n时钟周期 1/n时钟周期 指令级并行度ILP 1 m n m×n 1 2 3 4 5 6 7 8 指令级并行度 2.5 2.0 1.5 1.0 0.5 0.0 超标量处理机 超标量超流水线处理机 超流水线处理机 相 对 性 能 图3.25 3种指令级并行处理机的相对性能 【例3.10】 设指令流水线由取指、分析、执行3个部件组成,每个部件执行时间为 ,连续流入12条指令,假设指令之间没有相关。请分别画出单发射处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算出它们相对于单发射处理机的加速比。 解 单发射处理机的ILP=1,连续执行12条指令的时空图如图3.26所示。 t(Δt) 执行 1 2 3 4 5 6 7 8 9 10 11 12 分析 1 2 3 4 5 6 7 8 9 10 11 12 取指 1 2 3 4 5 6 7 8 9 10 11 12 图3.26 例3.10的单发射处理机的时空图 执行完12条指令所需时间为 超标量处理机的ILP=4,连续执行12条指令的时空图如图3.27所示。执行完12条指令所需时间为 ,相对于单发射处理机的加速比为 4 8 12 3 7 11 2 6 10 1 5 9 4 8 12 3 7 11 2 6 10 1 5 9 4 8 12 3 7 11 2 6 10 1 5 9 执行 分析 取指 t(Δt) 0 1 2 3 4 5 图3.27 例3.10的超标量处理机的时空图 超长指令字处理机的ILP=4,连续执行12条指令的时空图如图3.28所示。时空图中数字1表示由指令1~4组成的超长指令1,数字2表示由指令5~8组成的超长指令2,数字3表示由指令9~12组成的超长指令3。执行完12条指令所需时间为 ,相对于单发射处理机的加速比为 执行

文档评论(0)

克拉钻 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档