四川大学计算机系统结构课件第4章 向量处理机.pptVIP

四川大学计算机系统结构课件第4章 向量处理机.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在流水线处理机中,设置向量数据表示和相应的向量指令,称为向量处理机。 不具有向量数据表示和相应的向量指令的流水线处理机,称为标量处理机。 3.6 向量处理机 横向(水平)处理方式 向量计算是按行的方式从左到右横向地进行。 先计算: d1←a1×(b1+c1) 再计算: d2←a2×(b2+c2) …… 最后计算: dN←aN×(bN+cN) 组成循环程序进行处理。 ki←bi+ci di←ki×ai 数据相关:N 次 功能切换:2N 次 不适合于向量处理机的并行处理。 3.6 向量处理机 2. 纵向 (垂直)处理方式 向量计算是按列的方式从上到下纵向地进行。 k1←b1+c1 d1←k1×a1 先计算 …… 再计算 …… kN←bN+cN dN←kN×aN 表示成向量指令: K=B+C D=K×A 两条向量指令之间: 数据相关:1次 功能切换:1次 3.6 向量处理机 对处理机结构的要求:存储器-存储器结构 向量指令的源向量和目的向量都存放在存储器中,运算的中间结果需要送回存储器。 存储器-存储器型操作的运算流水线 例如:STAR-100、CYBER-205 3.6 向量处理机 3. 纵横 (分组)处理方式 又称为分组处理方式。 把向量分成若干组,组内按纵向方式处理,依次处理各组。 对于上述的例子,设: N=S×n+r 其中N为向量长度,S为组数,n为每组的长度,r为余数。 若余下的r个数也作为一组处理,则共有S+1组。 运算过程为: 3.6 向量处理机 先算第1组: k1~n←b1~n+c1~n d1~n←k1~n×a1~n 再算第2组: k(n+1)~2n←b(n+1)~2n+c(n+1)~2n d(n+1)~2n←k(n+1)~2n×a(n+1)~2n 依次进行下去,直到最后一组:第S+1组。 每组内各用两条向量指令。 数据相关:1次 功能切换:2次 3.6 向量处理机 对处理机结构的要求:寄存器-寄存器结构 设置能快速访问的向量寄存器,用于存放源向量、目的向量及中间结果,让运算部件的输入、输出端都与向量寄存器相联,构成寄存器-寄存器型操作的运算流水线。 典型的寄存器-寄存器结构的向量处理机 美国的CRAY-1、我国的YH-1巨型机 3.6 向量处理机 以CRAY-1机为例 美国CRAY公司 1976年 每秒1亿次浮点运算 时钟周期:12.5 ns CRAY-1的基本结构 功能部件 共有12条可并行工作的单功能流水线,可分别流 水地进行地址、向量、标量的各种运算。 3.6 向量处理机 6个单功能流水部件:进行向量运算 整数加(3拍) 逻辑运算(2拍) 移位(4拍) 浮点加(6拍) 浮点乘(7拍) 浮点迭代求倒数(14拍) 括号中的数字为其流水经过的时间,每拍为一个 时钟周期,即12.5 ns。 3.6 向量处理机 向量寄存组V 由512个64位的寄存器组成,分成8块。 编号:V0~V7 每一个块称为一个向量寄存器,可存放一个长度 (即元素个数)不超过64的向量。 每个向量寄存器可以每拍向功能部件提供一个数据元素,或者每拍接收一个从功能部件来的结果元素。 标量寄存器S和快速暂存器T 标量寄存器有8个:S0~S7 64位 快速暂存器T用于在标量寄存器和存储器之间提供缓 冲。 3.6 向量处理机 向量屏蔽寄存器VM 64位,每一位对应于向量寄存器的一个单元。 作用:用于向量的归并、压缩、还原和测试操作、 对向量某些元素的单独运算等。 CRAY-1向量处理的一个显著特点 每个向量寄存器Vi都有连到6个向量功能部件的单独总线。 每个向量功能部件也都有把运算结果送回向量寄存器组的总线。 3.6 向量处理机 只要不出现Vi冲突和功能部件冲突,各Vi之间和各 功能部件之间都能并行工作,大大加快了向量指 令的处理。 Vi冲突:并行工作的各向量指令的源向量或结果向量使用了相同的Vi。 例如:源向量相同 V3←V1+V2 V5←V4∧V1 功能部件冲突:并行工作的各向量指令要使用同一个功能部件。 例如:都需使用乘法功能部件 V3←V1×V2 V5←V4×V6 3.6 向量处理机 CRAY-1向量指令类型 Vk ← Vi op Vj Vk ← Si op Vj Vk ← 主存 主存 ← Vi 3.6 向量处理机 提高向量处理机性能

文档评论(0)

ormition + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档