网站大量收购独家精品文档,联系QQ:2885784924

【体系结构课件】向量处理机.PPT

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
向量由一组有序、具有相同类型和位数的元素组成。 在流水线处理机中,设置向量数据表示和相应的向量指令,称为向量处理机。 不具有向量数据表示和相应的向量指令的流水线处理机,称为标量处理机。 典型的向量处理机 1976年 Cray-1超级计算机 浮点运算速度达到了每秒1亿次 CDC Cyber 205,Cray Y-MP,NEC SX-X/44,Fujitsu VP2600等 性能达到了每秒几十亿~几百亿次浮点运算 以计算表达式 D=A×(B-C)为例 A、B、C、D ── 长度为 N 的向量 4.1 向量的处理方式 横向(水平)处理方式 向量计算是按行的方式从左到右横向地进行。 先计算: d1←a1×(b1-c1) 再计算: d2←a2×(b2-c2) …… 最后计算: dN←aN×(bN-cN) 组成循环程序进行处理。 qi←bi-ci di←qi×ai 数据相关:N次 功能切换:2N次 不适合于向量处理机的并行处理。 4.1 向量的处理方式 纵向 (垂直)处理方式 向量计算是按列的方式从上到下纵向地进行。 q1←b1-c1 d1←q1×a1 先计算 …… 再计算 …… qN←bN-cN dN←qN×aN 表示成向量指令: Q=B-C D=Q×A 两条向量指令之间: 数据相关:1次 功能切换:1次 4.1 向量的处理方式 纵横 (分组)处理方式 又称为分组处理方式。 把向量分成若干组,组内按纵向方式处理,依次处理各组。 对于上述的例子,设: N=S×n+r 其中N为向量长度,S为组数,n为每组的长度,r为余数。 若余下的r个数也作为一组处理,则共有S+1组。 运算过程为: 4.1 向量的处理方式 先算第1组: Q1~n←B1~n-C1~n D1~n←Q1~n×A1~n 再算第2组: Q(n+1)~2n←B(n+1)~2n-C(n+1)~2n D(n+1)~2n←Q(n+1)~2n×A(n+1)~2n 依次进行下去,直到最后一组:第S+1组。 每组内各用两条向量指令。 数据相关:1次 功能切换:2次 向量处理机的结构因具体机器不同而不同。 由所采用的向量处理方式决定。 有两种典型的结构 存储器-存储器型结构 纵向处理方式采用 寄存器-寄存器型结构 分组处理方式采用 4.2 向量处理机的结构 4.2 向量处理机的结构 4.2 向量处理机的结构 要充分发挥这种结构的流水线效率,存储器要不断地提供源操作数,并不断地从运算部件接收结果。 (每拍从存储器读取两个数据,并向存储器写回一个结果) 对存储器的带宽以及存储器与处理部件的通信带宽提出了非常高的要求。 解决方法:一般是通过采用多体交叉并行存储器和缓冲器技术。 例如,70年代初问世的Star 100 存储器:32个体交叉 每个体的数据宽度:8个字(字长64位) 最大数据流量:每秒2亿字 4.2 向量处理机的结构 在向量的分组处理方式中,对向量长度N没有限制,但组的长度n却是固定不变的。 对处理机结构的要求:寄存器-寄存器结构 设置能快速访问的向量寄存器,用于存放源向量、目的向量及中间结果。让运算部件的输入、输出端都与向量寄存器相联,就构成了“寄存器-寄存器”型操作的运算流水线。 典型的寄存器-寄存器结构的向量处理机 美国的CRAY-1、我国的YH-1巨型机 4.2 向量处理机的结构 以CRAY-1机为例 美国CRAY公司 1976年 每秒1亿次浮点运算 时钟周期:12.5ns CRAY-1的基本结构 功能部件 共有12条可并行工作的单功能流水线,可分别流 水地进行地址、向量、标量的各种运算。 4.2 向量处理机的结构 6个单功能流水部件:进行向量运算 整数加(3拍) 逻辑运算(2拍) 移位(4拍) 浮点加(6拍) 浮点乘(7拍) 浮点迭代求倒数(14拍) 括号中的数字为其流水经过的时间,每拍为一个 时钟周期,即12.5ns。 4.2 向量处理机的结构 向量寄存组V 由512个64位的寄存器组成,分成8块。 编号:V0~V7 每一个块称为一个向量寄存器,可存放一个长度 (即元素个数)不超过64的向量。 每个向量寄存器可以每拍向功能部件提供一个数据元素,或者每拍接收一个从功能部件来的结果元素。 标量寄存器S和

文档评论(0)

精品资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档