计算机系统结构课件第12章.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机系统结构课件第12章

阵列处理机 核心:一个由多个处理单元构成的阵列 采用资源重复的方法,设置较多的处理单元来提高并行性。 用单一的控制部件来控制多个处理单元对各自的数据进行相同的运算和操作。 又称为SIMD计算机。 有时还被称为并行处理机。 阵列处理机的操作模型 用一个控制部件CU同时管理多个处理单元PE。 CU对指令进行译码,并把指令播送到各处理单元。 所有处理单元均被动地接收并执行从控制部件广播来的同一条指令,但它们所操作的对象却是不同的数据。 12.1 阵列处理机的操作模型和特点 12.1 阵列处理机的操作模型和特点 阵列处理机的操作模型可用五元组表示 阵列处理机=(N,C,I,M,R) 其中: N:机器的处理单元(PE)数。 例如:Illiac Ⅳ计算机有64个PE MP-1计算机有16384个PE C:控制部件CU直接执行的指令集,包括标量指令和程序流控制指令。 I:由CU广播至所有PE进行并行执行的指令集。 包括算术运算、逻辑运算、数据寻径、屏蔽以及其他由每个PE对它的数据所执行的局部操作。 12.1 阵列处理机的操作模型和特点 M:屏蔽方案集 每种屏蔽将所有PE划分成允许操作和禁止操作两种工作模式。 R:数据寻径功能集 说明互连网络中PE间通信所需要的各种设置模式。 例如:MasPar MP-1计算机的操作特性如下: (1)MP-1是一种SIMD机器,其PE数N=1024~16384。 (2)CU执行标量指令,将译码后的向量指令广播到PE阵列, 并控制PE间通信。 (3)每个PE都是RISC处理机,能执行不同数据的整数运算和 标准浮点运算。PE从CU接收指令。 12.1 阵列处理机的操作模型和特点 (4)屏蔽方案设在每个PE中,并由CU连续监控,它能在运行 时动态地使每个PE处于工作或禁止状态。 (5)MP-1有一个X-Net网格网络和一个全局多级交叉开关寻径 器,以实现CU-PE之间、X-Net的8个近邻和全局寻径器的通信。 阵列处理机的特点 以单指令流多数据流方式工作。 通过设置多个相同的处理单元来开发并行性。 利用并行性中的同时性,而不是并发性。所有处理单元必须同时进行相同的操作。 以某一类算法为背景的专用计算机。 12.1 阵列处理机的操作模型和特点 阵列机的研究必须与并行算法的研究密切结合,以便能充分发挥它的处理能力。 阵列机的控制器实质上是一台标量处理机,而为了完成I/O操作以及操作系统的管理,尚需一个前端机。 实际的阵列机系统是由3部分构成的一个异构型多处理机系统。 分布式存储器的阵列机结构 含有多个相同的处理单元PE,每个PE有各自的本地存储器LM。 PE之间通过数据寻径网络以一定方式互相连接。它们在阵列控制部件的统一指挥下,实现并行操作。 指令的执行顺序基本上是串行进行的。 程序和数据是通过主机装入控制存储器。 12.2 阵列处理机的基本结构 12.2 阵列处理机的基本结构 指令送到控制部件进行译码。 标量指令:直接由标量处理机执行。 向量指令:阵列控制部件通过广播总线将它广播到所有PE中去并行地执行。 执行程序所需的数据集经划分后通过数据总线分布存放到各PE的本地存储器LM。 各PE之间通过数据寻径网络互连,实现PE间的通信,控制部件通过执行程序来控制数据寻径网络。 PE的同步是在控制部件的控制下由硬件实现。 可以让所有PE在同一个周期执行同一条指令 12.2 阵列处理机的基本结构 也可以通过采用屏蔽逻辑来控制某些PE在指定的指令周期是否参与执行 各种阵列处理机的主要差别 在于数据寻径网络的不同。 Illiac Ⅳ: 4-邻连接网络结构 (在过去是最常用的一种) CM-2:嵌在网格中的超立方体 MasPar MP-1:X-Net加多级交叉开关寻径器 12.2 阵列处理机的基本结构 共享存储器的阵列处理机结构 集中设置存储器 共享的多体并行存储器SM通过对准网络与各处理单元PE相连。 存储模块的数目等于或略大于处理单元的数目。 必须减少存储器访问冲突 (将数据合理地分配到各存储器模块中 ) 在处理单元数目不太多的情况下是很理想的 所有阵列指令都必须使用长度为n的向量操作数 (n为PE的个数) 12.2 阵列处理机的基本结构 美国宝来公司和伊利诺大学合作研制 1972年 最早的阵列处理机 一个由3种类型处理机联合组成的多机系统 处理单元阵列:专门用于数组运算 阵列控制器(CU):既是处理单元阵列的控制部分,又可以看作是一台相对独立的小型标

您可能关注的文档

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档