第6章__阵列处理机分析.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章__阵列处理机分析

第6章 阵列处理机 6.1 阵列处理机原理 6.2 阵列处理机的并行算法 6.3 SIMD计算机的网络互连 6.4 并行存储器的无冲突访问 6.5 并行处理机举例 ?本章重点: 总的要求是理解阵列处理机的结构和工作原理。了解与流水处理机的差别。理解在阵列处理机解题时对并行算法及存储单元分配规则、互连网络等的特殊要求。熟练掌握基本的单级网络及其互连函数表示。理解循环互连网络的实现。熟练掌握多级网络、全排列网络的画法。理解解决并行存储器无冲突访问的办法。 互连函数和多级互连网络。 ?本章难点: 并行算法和多级互连网络。 6.1 阵列处理机原理 6.1.1 阵列处理机的基本构形 阵列处理机(Array Processor),也称为并行处理机(Parallel Processor)主要用于对大量向量、数组要求高速运算的场合。 阵列处理机是重复设置处理单元按一定方式连成阵列在单一控制部件控制下对各自分配的数据执行同一指令规定的操作,是操作级并行的SIMD的计算机。 由于存储器的组成方式不同,阵列处理机有两种不同的基本构形。 1、分布式存储器的阵列处理机构形 各处理单元有局部存储器PEM(Processing Element Memory)存放被分布的数据,只能被本处理单元直接访问。在控制部件CU上有一主存可传播给各个处理单元,运算中可通过互连网络ICN交换数据。 在执行主存中的用户程序时,所有指令都在控制部件中进行译码,把只适合串行处理的标量或控制类指令留给控制部件CU自己执行,而把适合于并行处理的向量类指令“播送”给各个PE,控制处于“活跃”的那些PE并行执行。下图是采用分布式存储器的阵列处理机构形。 为了有效高速地处理向量数据,这种构形要求能把数据合理地预分配到各个处理单元的局部存储器中,使各处理单元PEi主要用自己的局存PEMi中的数据运算。 采用这种构形的阵列处理机是SIMD的主流。典型机器有ILLIAC Ⅳ 、MPP、 DAP、CM-2、MP-1、DAP600系列等。 2、集中式共享存储器的阵列处理机构形 系统存储器由K个存储体集中组成,并经ICN为全部N个处理单元所共享。 为使各处理单元对长度为N的向量中各个元素都能同时并行处理,存储体体数K应等于或多于处理单元数N。 各处理单元在访主存时,为避免发生分体冲突,也要求有合适的算法能将数据合理地分配到各个存储体中。 互连网络ICN是用于在处理单元与存储器分体之间进行转接构成数据通路,使各处理单元能高速灵活地动态与不同的存储体相连,使尽可能多的PE能无冲突地访问共享的主存模块。 集中式共享存储器的阵列处理机主要特点是将资源重复和时间重复结合起来开发并行性。 采用这种构形的典型机器有BSP。 6.1.2 阵列处理机的特点 1、利用资源重复而不是时间重叠;利用并行性中的同 时性而不是并发性。 2、资源利用率不如流水线高,但提高速度的潜 力比流水线处理机大。(阵列处理机主要是 靠增大处理单元数提高速度,向量流水处理 机主要靠缩短时钟周期提高速度)。 3、阵列处理机使用简单规整的互连网络来确定处 理单元间的连接,因此,互连网络设计很重要。 4、它是以某类算法为背景的专用计算机,基本上 是专用于向量处理的计算机(某类算法专用机), 故阵列处理机专用性强。 5、阵列机的研究必须与并行算法研究密切结合,以使它的求解算法适应性更强一些,应用面更广一些(与并行算法结合研究)。 阵列处理机实质上是由专门对付数组运算的处理单元阵列组成的处理机、专门从事处理单元阵列的控制及标量处理的处理机和专门从事系统输入输出及操作系统管理的处理机组成的一个异构型多处理机系统。 6.2 阵列处理机的并行算法 6.2.1 ILLIAC Ⅳ的处理单元阵列结构 ILLIAC IV处理阵列由8?8=64个PU组成。每个PU由处理部件PE和它的局部存储器PEM组成。 每一个PUi只和它的上、下、左、右四个近邻直接连接。{PUi+1 mod 64、PUi-1 mod 64、PUi+8 mod 64、PUi-8 mod 64} 上下方向上同一列的PU连成一个环,左右方向上构成一个闭合螺线。 采用闭合螺线最短距离不超过7步。而普通网格最短距离不超过8步。这种阵列中,任意两个单元之间的最短距离不超过 步。 例如:从P

文档评论(0)

wbjsn + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档