例如:有如下3条向量指令: 1: V3 ? A 2: V2 ? V0+V1 3: V4 ? V2×V3 第1、2条指令没有数据相关和功能部件冲突,可以同时开始执行。 第3条指令与第1、2条指令均存在写读数据相关,可以链接执行。 浮点加 7 1 2 3 4 5 6 Mem V0 V1 V2 V3 V4 1 2 3 4 5 6 1 2 3 4 5 6 浮点乘 三种执行方式比较: (1) 如果向量长度为N,三条指令采用串行方法 执行的时间为: [(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1] = 3N+22 拍 (2) 如果前两条指令并行执行,第三条指令串行 执行,则执行时间为: [(1+6+1)+N-1]+[(1+7+1)+N-1] = 2N+15 拍 (3) 如果采用链接技术,则执行时间为: (1+6+1)+(1+7+1)+(N-1)=17+N-1 = N+16 拍 实现链接的条件: (1)没有源向量寄存器冲突和运算部件冲突。 (2)只有前一条指令的第一个结果分量送入结果向量寄存器的那一个周期可以链接。 (3)当后面一条指令所需的两个源操作数分别是前面两条指令的结果寄存器时,先行的两条指令产生运算结果的时间必须相等。 (4)两条向量指令的向量长度必须相等。 向量循环开采技术 当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,采用循环结构处理这个长向量,这种技术称为向量循环开采技术,也称为向量分段开采技术。 例6.2:A和B为长度N的向量。 for (i=1; iN; i++) a[i]=5*b(i)+c; 当向量长度N为64或更小时,计算A数组的7条指令序列是: 1:S1?5.0 在标量寄存器内设置常数 2:S2?C 将常数C装入标量寄存器 3:VL?N 在VL寄存器内设置向量长度 4:Vo?B 将B向量读入向量寄存器 5:V1?S1 ? Vo B数组的每个分量乘常数 6:V2?S2+V1 C和5 ? B(x)相加 7:A?V2 将结果向量存入A数组 当N超过64时,要采用向量循环开采技术。 在进入循环前,把N除以64,确定循环次数。 第4条到第7条指令组成循环 1:S1?5.0 在标量寄存器内设置常数 2:S2?C 将常数C装入标量寄存器 3:VL?N 在VL寄存器内设置向量长度 for (i=0; i=N/64; i++) { 4:Vo?B 将B向量读入向量寄存器 5:V1?S1 ? Vo B数组的每个分量乘常数 6:V2?S2+V1 C和5 ? B(x)相加 7:A?V2 将结果向量存入A数组 } 向量递归技术 向量指令一般为3地址,但递归运算用两地址。 用递归向量技术求和: V0?V0+V1 C0和C1分别是与向量寄存器V0和V1相关的分量计数器。初始时,计数器C0和C1都置成0,V00中的初始值也置成0。 浮点加法流水线的延迟时间为8个周期。 假定向量长度为64,只作一个向量循环。 在开始的8个周期,计数器C0一直为0,在此之后,每个周期加1。C1每个周期加1。 V00=V00+V10=0+V10 V01=V00+V11=0+V11 …… V07=V00+V17=0+V17 V08=V00+V18=V10+V18 …… V015=V07+V115=V17+V115 V016=V08+V116=V10+V18+V116 …… V056=V048+V156=V10+V18+V116+V124+V132+V140+V148+V156 …… V063=V055+V163=V17+V115+V123+V131+V139+V147+V155+V163 经过8次运算,得到8个结果,分别是8个数的和 第1次加法 第2次加法 第8次加法 向量处理机主要出自美国和日本。 美国著名的向量计算机公司有: CRAY CDC TI等 日本公司有: NEC Fujitsu Hitachi等 典型的向量处理机 机器型号 美国和日本制造的向量处理机 Cray IS 配置 特点 有10条流水线的单处理机,12.5ns,COS/CF7 2.1 第一台基于ECL的超级计算机,1976年问世 典型向量处理机 Cray 2S/4-256 256M字存
您可能关注的文档
最近下载
- 2026年开工第一课主题.ppt
- 普通纪念币防伪课件.pptx VIP
- ASTM A388A388M-2018钢锻件超声检验标准操作方法中文版.pdf VIP
- 艺考真题|2020年中传文史哲初试真题原卷放送(附答案).doc VIP
- 毛石混凝土挡土墙施工方案.docx
- 八年级英语上册全册课课练.doc VIP
- POEMS综合征课件完整版.ppt VIP
- NB-T11409-2023水电工程费用构成及概(估)算费用标准.docx VIP
- 2026年春季学期学校德育工作计划.docx VIP
- 深度解析(2026)《TBT 3474.2-2018机车车辆螺纹连接软管 第2部分:橡胶软管》.pptx VIP
原创力文档

文档评论(0)