第5章 向量流水和向量处理机.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 向量流水和向量处理机

第5章 向量流水与向量处理机;第5章 向量流水与向量处理机;5.1 向量流水的概念与工作原理;5.1.1 向量流水的概念与特点; 2.向量流水处理的主要特点 ① 一条向量指令相当于一个标量循环。这样,可降低对指令访问速度(带宽)的要求,还可消除标量机中由于循环而引起的控制(资源)相关。 ② 每一个结果元素仅与参加运算的元素有关,与上一次运算的值无关,因此向量流水线可以有较大的深度。 ③ 若要访问的向量元素相邻,可存储到多体交叉存储器中,以提高访存速度。 ④ 在一般向量流水机中,允许访问存储器与有效地址的计算流水化,在高档向量流水机中还允许多个向量操作同时进行,即多向量并行操作。;5.1.2 向量处理机的基本组成; 2.向量处理机的基本组成 1976年美国CRAY公司推出寄存器—-寄存器结构的向量机,易操作,速度快,指令系统简洁,因而很快成为向量处理机的主流机型。比如CRAY公司的Y-MP和C-90,日本Fujitsu公司的VP2000、VPP300/500,以及我国的YH等。 向量机的基本结构如图5.1所示,由一个标量流水部件和一个向量流水部件组成。其中标量流水部件是为实现向量中的标量运算而设置的,包括标量功能部件和若干个标量寄存器。向量流水部件主要用于向量运算,包括向量功能部件、向量存取部件、向量寄存器以及向量控制器等。;图5.1 向量处理机基本系统结构 ;3.向量运算 【例5.1】设有长度同为64的两个向量X和Y,其地址分别由寄存器Rx和Ry表示,通过分析Y=a×X+Y,来说明向量运算过程,其中a 为标量。 解:根据题意a为标量,每一个向量元素占8个字节单元,在标量计算机中通过循环程序实现向量运算,程序如下: LD F0,a, ;标量a送入寄存器F0 ADDI R4,Rx,#512 ;向量元素的末地址送入R4 LOOP:LD F2,0(Rx) ;取向量元素X(i) MULD F2,F0,F2 ;F2←a×X(i) LD F4,0(Ry) ;取向量元素Y(i) ADDD F4,F2,F4 ;F4←a×X(i)+ Y(i) SD 0(Ry),F4 ;存结果元素 ADDI Rx,Rx,#8 ;修改向量X元素的下标 ADDI Ry,Ry,#8 ;修改向量Y元素的下标 SUB R10,R4,Rx ;R10←(R4)-(Rx) BNZ R10,LOOP ;若没有结束转移到LOOP; 在向量机上使用向量机指令编程如下,其中Rx和Ry表示向量寄存器: LD F0,a ;标量a送入寄存器F0 LV V1,Rx ;取向量X MULTV V2,F0,V1 ;V2←a×X LV V3,Ry ;取向量Y ADDV V4,V2,V3 ;V4←a×X+ Y SV Ry,V4 ;存结果 通过对上述程序进行分析可以看出,在标量机上进行运算共执行9×64+2=578条指令,其中还包含大量的延迟等待。而在向量机上进行运算,仅需要6条向量指令。;5.1.3 向量启动时间与结果流出时间; 可以看出,对于运算速度较慢的向量流水操作,启动时间影响不大;对于速度较快向量流水操作,启动时间会产生较大的影响。 对于寄存器—-寄存器型向量处理机来说,向量启动时间主要取决于功能部件流水线的深度,结果流出时间取决于向量功能部件以多快的频率接收数据。当向量较长时,启动稳定后的结果流出时间可视为1。;5.1.4 向量操作长度控制与向量访问步长; 当向量长度小于向量寄存器的长度时,直接存入向量寄存器,其长度存入向量长度寄存器中。如果向量长度大于向量寄存器的长度时,须分段存储和运算。向量长度寄存器的值等于向量寄存

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档