网站大量收购独家精品文档,联系QQ:2885784924

5.3 5.4向量机的.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.3 5.4向量机的

2.5 向量机;; 主 存 ;超标量机的主要特点;VLIW机的工作原理;VLIW机的主要特点;VLIW机的结构图;例:;源代码;经VLIW调度后的指令;比较类型;VLIW计算机曾经有过商品化的机器,如美国的 Multiflow 公司生产的TRACE型号机器,以及Cydrome 公司生产的Cydra5.但由于性能价格比不理想等原因已停止生产VLIW机器,但是计算机所采用的压缩技术已广泛使用。;;标量流水机性能的提高受到下面两个因素影响:;;一、向量流水机的基本系统结构;一条向量指令相当于一个标量循环,所以可以减少指令,从而可以降低对指令访问带宽的要求。并且消除了由循环引起的控制相关。 若向量指令所要访问的向量元素均相邻,则可以在交叉存储体中高速地依次访问它们。这使得访存时间缩短。 向量操作要比一串标量指令操作更快。;;; 主存 ;;Y= a×X+Y(a为标量,X、Y为向量);;比较;3.向量启动时间和启动率 基本的向量流水操作就是在对一条指令进行流水操作,也就是用流水的方法对向量元素进行操作。当一条向量指令开始执行时,就开启了一条向量流水线,从开始启动到流水运行结束的时间就是向量指令的执行时间。 ;;;二、向量操作长度控制和向量访问步长;三、向量的处理方法;D = A×(B+C);D = A×(B+C);D = A×(B+C);四、增强向量处理性能的方法;1、多功能部件的并行操作;;;CRAY-1;;;;;;;;;整数加3;2、链接技术;;使用这个技术的条件是: 1、两条指令间存在先写后读的数据相关性。也就是前一条指令的结果正好为后一条指令的数据源。可以在上一条指令将结果传送到结果寄存器的同时就直接传给下一指令的功能部件作为操作数进行操作,这就节省了等待时间。 ; 2、时间上的要求,就是当前一指令的第一个结果分量送入结果寄存器的那一个时钟周期方可链接,若错过这一拍,就无法链接。如果一条向量指令的源操作数是前面两条并行操作指令的结果数时,只有这两条指令产生结果的时间必须相等才可进行链接。也就是说,链接操作得丝丝入扣,一拍不差,早也不行,晚也不行,多也不行,少也不行。;我们应该能够判断一串指令是否可以并行或链接,并能计算其执行时间。;在CRAY-1上执行D=A×???B+C);三条指令的不同执行方法:;采用一个屏蔽向量来控制某些向量元素参加运算。 例如:do 100 i=1,64 if ( A(i) .ne. 0 ) then A(i)=A(I)-B(i) endif 100 continue;;屏蔽向量寄存器控制向量指令执行方法的缺点是:;通过指标向量来指明非零元素并通过指标向量的散射-聚合操作来支持稀疏矩阵的运算。 ;4.向量归约操作的加速方法,这种方法就是将标量循环的一部件加以向量化,并采用递归折叠的方法来加快向量归约操作。;五、向量处理性能的评估参数和方法;;六、向量化编译技术; ;;向量 向量运算 向量处理特点 向量 相关问题 数据相关 资源相关 提高向量处理速度 并行:不冲突,取长时间 链接:数据相关,两个操作数同时到。;;;;向量长度N,N64. 取数: 1+6+(N-1 )+1 加: 6+(N-1 ) 乘: 7+(N-1 ) 串行:6+(N-1 )+ 6+(N-1 )+ 7+(N-1 ) 1和2,3串: 6+(N-1 )+ 7+(N-1 ) 1和2,3链: 6+7+(N-1) ;三条指令并行执行:1+7+63+1=72 1,2并行与3链接:1+7+1+63+1+6+1 1,2链接,3,4,串 1+6+1+1+7+1+63+1+6+1++63 +1+6+1++63 1+6+1+ 1+14+1+ 1+7+1+1+6+1+63;6.2与标量机相比向量流水的特点是什么? 答:向量流水处理的特点是: (1)在向量操作中,每个当前结果向量元素的计算与以前结果向量元素的计算是相互独立的,这就允???向量流水线有较深的深度。 (2)一条向量指令相当于一个标量循环,从面可降低对指令访问带宽的要求。此外,这也消除了由循环转移可能引起的控制相关。;(3)若向量指令所要访问的向量元素均相邻,则可以在交叉存储体中高速地依次访问它们。由于一个向量中通常含有多个元素,因此对存储器访问的延迟平均到每个元素上,其访丰等待的时间开销是较小的。 与标量流水机相比,向量操作要比一串标量指令操作更快,此外,向量流水机还可使访丰和有效地址计算流水化,高档的向量机还允许多个向量操作同时进行,从而可开发对不同元素进行多个向量操作的并行性。;向量的工作方式有哪两种?各有何特点?;向量的加工方法有哪几种?从加工速度和需要的中间变量等方面分析各有何特点?;;;

文档评论(0)

ayangjiayu3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档