计算机系统结构06向量处理机121106.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构06向量处理机121106

* 6.4.2 向量链接技术 向量指令类型: 以CRAY-1向量处理机为例,四类指令,两种指令格式: (1)向量与向量操作:Vi Vj OP Vk (2)向量与标量操作:Vi Sj OP Vk (3)向量取:Vi 存储器 (4)向量存:Vi 存储器 * 向量运算中的相关和冲突 向量运算中的数据相关和功能部件冲突: 采用顺序发射顺序完成方式 (1)写读数据相关。 (2)读读数据相关,或向量寄存器冲突。 (3)运算部件冲突。 V0 V1+V2 V0 V1+V2 V3 V4+V5 V3 V0×V4 (a)不相关指令 (b)写读数据相关 * V0 V1+V2 V0 V1+V2 V3 V4+V5 V3 V1×V4 (c )功能部件冲突 (d)读读数据相关 向量链接技术(chaining) 当前一条指令的结果寄存器可以作为后续指令的操作数寄存器时,多条有数据相关的向量指令并行执行,这种技术称为向量链接技术。 * 例如:有如下3条向量指令: 1:V3 A 2:V2 V0+V1 3:V4 V2×V3 第1、2条指令没有数据相关和功能部件冲突,可以同时开始执行。 第3条指令与第1、2条指令均存在写读数据相关,可以链接执行。 * 浮点加 7 1 2 3 4 5 6 Mem V0 V1 V2 V3 V4 1 2 3 4 5 6 1 2 3 4 5 6 浮点乘 * 如果向量长度为N,三种执行方式比较: (1) 三条指令采用串行方法执行时间为: [(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1)]=3N+22拍 (2)如果前两条指令并行执行,第三条指令串行执行,则执行时间为: [(1+6+1)+N-1]+[(1+7+1)+N-1] =2N+15拍 (3)如果采用链接技术,则执行时间为: (1+6+1)+(1+7+1)+(N-1)=17+N-1=N+16拍 * 实现链接条件: (1)没有向量寄存器冲突和运算部件冲突。 (2)只有第一个结果送入向量寄存器的那一个周期可以链接。 (3)先行的两条指令产生运算结果的时间必须相等。 (4)两条向量的向量长度必须相等。 * 6.4.3 向量循环开采技术 当向量的长度大于向量寄存器的长度时,必须把长向量分成长度的段,采用循环结构处理这个长向量,这种技术称为向量循环开采技术,也称为向量分段开采技术。 例:A和B为长度N的向量。 for (I=1;IN;I++) a[I]=5×b(I)+c 当向量长度N为64或更小时,计算A数组的7条指令序列是: * 1: S1 5.0 在标量寄存器内在设置常数 2: S2 C 将常数C装入标量寄存器 3: VL N 在VL寄存器内设置向量长度 4: V0 B 将B向量读入向量寄存器 5: V1 S1*V0 B数组的每个分量乘常数 6: V2 S2+V1 C和5*B(X)相加 7: A V2 将结果向量存入A数组。 当N超过64时,要采用向量循环开采技术。 在进入循环前,把N除已64,确定循环次数。 如果有余数,则在第一次循环中首先计算。 * 第4条到第7条指令组成循环 1: S1 5.0 在标量寄存器内在设置常数 2: S2 C 将常数C装入标量寄存器 3: VL N 在VL寄存器内设置向量长度 for (I=0;I=n/64;I++){ 4: V0 B 将B向量读入向量寄存器 5: V1 S1*V0 B数组的每个分量乘常数 6: V2 S2+V1 C和5*B(X)相加 7: A V2 将结果向量存入A数组。 } * 6.4.4 向量递归技术 向量指令一般为3地址,但递归

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档