流水线.要点讲解.ppt

图 5.31 通过链接技术实现向量  指令之间大部分时间并行 CRAY—1启动访存,把元素送往功能部件,把结果存入Vi都需要有1拍的传送延迟。由于第一、二条指令之间没有冲突,可以同时执行,并且“访存”拍数正好与“浮加”的一样,因此,从访存开始,直至把第一个结果分量存入V4,所需拍数(亦称为链接流水线的建立时间)为 此后,每拍就可取得一个结果分量存入V4,一共只需17+(N-1)拍就可以执行完这3条向量指令,获得全部结果分量。 显然,这要比第一、二条指令全执行完,所有分量全部送入V2、V3后,才开始执行第三条指令要快得多,因为后者需1+6+1+N-1+1+7+1+N-1=15+2N拍。 CRAY—1指令可以链接的特点,使得它能灵活地组织各流水线功能部件的并行操作。最多能并行处理6条向量指令,进一步发挥这些流水线功能部件的效能。因此,链接技术是提高机器整体运算速度的一个非常重要的措施。  CRAY—1的向量指令还可以通过让源向量和结果向量使用同一个向量寄存器组,并控制分量计数器值的修改,来实现递归操作。  CRAY—1的每个向量寄存器组Vi都有一个相应的分量计数器。 当一条向量指令开始执行时,它的源向量寄存器和结果向量寄存器相应的分量计数器均置成“0”。 下面考虑用浮点加法流水线完成递归向量求和

文档评论(0)

1亿VIP精品文档

相关文档