[工学]15_阵列处理机.pptVIP

  • 4
  • 0
  • 约5.56千字
  • 约 36页
  • 2018-02-28 发布于浙江
  • 举报
[工学]15_阵列处理机

并行处理机的操作模型和特点 并行处理机的基本结构 并行处理机的并行算法 SIMD并行处理机(阵列处理机) 并行处理机的基本构成 并行处理机是通过重复设置大量相同的处理单元PE(Processing Element),将它们按一定的方式互连,在统一的控制部件CU(Control Unit)控制下,对各自分配来的不同数据并行地完成同一条指令所规定的操作。它依靠操作一级的并行处理来提高系统的速度。 并行处理机的控制部件中进行的是单指令流,因此与高性能单处理机一样,指令基本上是串行执行,最多加上使用指令重叠或流水线的方式工作。 指令重叠是将指令分成两类,把只适合串行处理的控制和标量类指令留给控制部件自己执行,而把适合于并行处理的向量类指令播送到所有处理单元,控制让处于活跃的那些处理单元去并行执行。因此这是一种标量控制类指令和向量类指令的重叠执行。 并行处理机的操作模型和特点 一、并行处理机的基本结构 运行方式:用一条指令同时对许多运算单元中的数据进行运算。 基本构成:控制器CU、处理单元PE、存储器模块、互连网络IN 控制单元:执行串行指令,并行指令广播到各个PE;PE以同步方式执行指令; 互连网络:集中式控制。 阵列并行指令:向量运算,数据寻径,屏蔽操作 SIMD并行处理机的操作模型可用五元组表示: SIMD=(N,C,I,M,R) N为机器的处理单元数。 C为控制部件CU直接执行的指令集,即标量指令和程序流控制指令。 I为由CU广播至所有PE进行并行执行的指令集,包括:算术运算、逻辑运算、数据寻径、屏蔽以及其他由每个PE对它的数据所执行的局部操作。 M为屏蔽方案集,其中每种屏蔽将所有PE划分成允许操作和禁止操作两种工作模式。 R是数据寻径功能集,说明互连网络中PE间通信所需要的各种设置模式。 阵列处理机的特点???? 阵列机是以单指令流多数据流方式工作的。 利用资源重复(空间因素)而非时间重叠。 阵列机是以某一类算法为背景的专用计算机。这是由于阵列机中通常都采用简单、规整的互连网络来实现处理单元间的连接操作,从而限定了它所适用的求解算法类别。因此,对互连网络设计的研究就成为阵列机研究的重点之一。 阵列机的研究必须与并行算法的研究密切结合,以使它的求解算法的适应性更强一些,应用面更广一些。 从处理单元来看,由于结构都相同,因而可将阵列机看成是一个同构型并行机。但它的控制器实质上是一个标量处理机,而为了完成I/O操作以及操作系统的管理,尚需一个前端机,因此实际的阵列机系统是由上述三部分构成的一个异构型多处理机系统 阵列处理机的基本思想: 可以通过各种途径把它们转化成为对数组或向量的处理,利用多个处理单元对向量或数组所包含的各个分量同时进行运算, 从而易于获得很高的处理速度。 专用,应用算法相关 适合于规则数据运算,不适合于条件分支程序 并行处理机分类 并行处理机根据存贮器采用的组成方式不同分成两种基本构成。 (1)分布存贮的并行处理机 各个处理单元设有局部存贮器存放分布式数据,只能被本处理单元直接访问。此种局部存贮器称为处理单元存贮器(Processing Element Memory)PEM。在控制部件CU内设有一个用来存放程序的主存贮器CUM。整个系统在CU统一控制下运行系统程序的用户程序。执行主存中的用户程序指令播送给各个PE,控制PE并行地执行。 分布式存储器的SIMD阵列处理机结构 指令送到控制部件进行译码 如果是标量指令,则直接由标量处理机执行。 如果是向量指令,则阵列控制部件通过广播总线将它广播到所有PE并行执行。 PE通过数据寻径网络互连,数据寻径网络执行PE间的通信。 控制部件通过执行程序来控制数据寻径网络。 PE在同一个周期执行同一条指令。但是可以用屏蔽逻辑来决定任何一个PE在给定的指令周期执行或不执行指令。 各种SIMD机器主要差别在于:进行PE之间互相通信的数据寻径网络各不相同。 (2)共享存贮的并行处理机结构 共享的多体并行存储器SM通过互连网络与各处理单元PE相连 存储模块的数目等于或略大于处理单元的数目 为了减少存储器访问冲突,存储器模块之间必须合理分配数据 互连网络是共享存储器SM和处理单元PE之间的必由之路 每个PE没有局部存储器 互连网IN受CU控制 分布式结构和集中式结构特点比较 流水线向量处理机并行处理机的区别 SIMD计算机与流水线向量处理机一样,特别适于高速数值计算。它是以诸如有限差分、矩阵、信号处理、线性规划等一系列计算问题为背景而发展起来的。 与按多指令流多数据流方式工作的多处理机相比,SIMD计算机具有较固定的结构,它直接与一定的算法相联系, SIMD计算机利用大量处理单元对向量所包含的各个分量同时进行运算,这正是它获得很高处理速度的主要原因。 SIMD计算机主

文档评论(0)

1亿VIP精品文档

相关文档