第6章-计算机系统结构(第五版)李学干.pptVIP

第6章-计算机系统结构(第五版)李学干.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章-计算机系统结构(第五版)李学干

6.1 向量的流水处理和向量流水处理机 6.2 阵列处理机的原理  6.3 SIMD计算机的互连网络 6.4 共享主存构形的阵列处理机中并行存储器的无冲突访问 6.5 脉动阵列流水处理机 6.6 本章小结;  ;【例 6-1】   计算D=A×(B+C),其中A、B、C、D都是有N个元素的向量,应该采用什么方式处理才能充分发挥流水线的效能   如果采用逐个求D向量元素的方法,即访存取ai、bi、ci元素求di,再取ai+1、bi+1、ci+1求di+1, 则这种处理方式称为横向(水平)处理方式。 ;6.1.2 向量流水处理机的结构举例   向量流水处理机的结构因具体机器的不同而不同。 图6 - 1只画出了CRAY-1中央处理机中有关向量流水处理部分的简图。 ;图 6-1 CRAY-1的向量流水处理部分简图;  CRAY-1有标量类和向量类指令共128条,其中有4种向量指令如图6 - 2所示。    第Ⅰ种源向量分别取自两个向量寄存器组Vj、Vk,结果送向量寄存器组Vi。第Ⅱ种与第 Ⅰ 种的差别只在于它的一个操作数取自标量寄存器Sj。 ;图 6-2 CRAY-1的四种向量指令;6.1.3 通过并行、链接提高性能   一般可采取让多个流水线功能部件并行、流水线链接、加快条件语句和稀疏矩阵处理、加快向量的归约操作等办法来提高向量流水处理的性能。 ;  以CRAY-1的向量流水为例,向量寄存器组Vi在同一时钟周期内可接收一个结果分量并为下次操作再提供一个源分量。每个Vi组都有单独的总线连到各功能部件上,而每个 功能部件也都有把运算结果送回向量寄存器组的输出总线。所谓Vi冲突,指的是并行工作的各向量指令的源向量或结果向量使用了相同的Vi。所谓功能部件冲突,指的是同一个功能部件被要求并行工作的多条向量指令所使用。 ;  第一、二条指令无任何冲突,可以并行执行。第三条指令与第一、二条指令出现Vi冲突,存在先写后读数相关,本来是不能并行执行的,但若能把第一、二条指令的结果分量直接链接进第三条指令所用的功能部件,那第三条指令就能与第一、二条指令在大部分时间内并行。它们的链接过程如图6 - 3所示。 ;图 6-3 通过链接技术实现向量指令之间大部分时间并行 ;6.1.4 提高向量流水处理速度的其他办法   1. 条件语言和稀疏矩阵的加速处理   当程序中出现条件语句或进行稀疏向量、矩阵运算时,难以发挥出向量处理的优点。   2. 向量递归操作的加速处理   CRAY-1的向量指令还可以通过让源向量和结果向量使用同一个向量寄存器组,并控制分量计数器值的修改,来实现递归操作。 ;  图6 - 4画出了其部分时间关系示意图。设源/结果向量寄存器组用V0,另一源向量寄存器组用V1。在指令开始执 行前,先把V0的零分量(V00)置“0”。V1置入需要运算的全部浮点数分量。向量长度寄存器VL的内容假定置为64。 ;图 6-4 递归向量和的部分时间关系;  运算结束后,V0中各个分量的内容如下: ;(V056)=(V048)+(V156) =(V10)+(V18)+(V116)+(V124)+(V132) +(V140)+(V148)+(V156) (V057)=(V049)+(V157) =(V11)+(V19)+(V117)+(V125)+(V133) +(V141)+(V149)+(V157) ;(V058)=(V050)+(V158) =(V12)+(V110)+(V118)+(V126)+(V134) +(V142)+(V150)+(V158) (V059)=(V051)+(V159) =(V13)+(V111)+(V119)+(V127)+(V135) +(V143)+(V151)+(V159);(V060)=(V052)+(V160) =(V14)+(V112)+(V120)+(V128)+(V136) +(V144)+(V152)+(V160) (V061)=(V053)+(V161) =(V15)+(V113)+(V121)+(V129)+(V137) +(V145)+(V153)+(V161);(V062)=(V054)+(V162) =(V16)+(V114)+(V122)+(V130)+(V138) +(V146)+(V154)+(

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档