《计算机系统结构》 课件 第五章 并行处理机.ppt

《计算机系统结构》 课件 第五章 并行处理机.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

(3)若将(2)中八个PE之间的连接由双向环结构改为单向环结构,则八个PE的连接图和操作数的初始存放位置如图5.21所示。数据寻径操作的算法如下:每个PE同时执行乘法四次,加法三次。PE0→PE1、PE2→PE3、PE4→PE5、PE6→PE7同时传递和、再加法一次。PE1→PE2→PE3、PE5→PE6→PE7同时传递和二次,再加法一次。PE3→PE4→PE5→PE6→PE7传递和四次,最后加法一次。因此,八个PE双向环并行处理所需的最小时间为t=4×4+3×2+1+2+2+2+5+2=35(单位时间)推广到一般情况略去动态连接网络动态连接网络可根据程序要求实现所需的通信模式。它不用固定连接,而是沿着连接路径使用开关或仲裁器以提供动态连接特性。根据级间连接方式,动态连接网络有单级相多级两类。单级网络只有有限的几种连接,任意两个结点之间的信息传送可能需经过在单级网络中循环多次才能实现,故单级网络也称循环网络。多级网络由多个单级网络串联组合而成,以实现任意两个结点之间的连接。级间连接模式的选择取决于网络连接特性,不同级的连接模式可能相同也可能不相同。在此基础上,还可将多级互连网络循环使用,以实现复杂的互连。1.总线互连方式的动态连接网络总线互连方式是实现动态连接最简单的一种结构形式。用一条公用系统总线将多个处理机、存储器模块和I/()部件通过各自的接口部件或是多个由CPU、本地存储器和I/O部件所组成的计算机模块通过公共的接口部件互连起来。2.交叉开关互连方式的动态连接网络交叉开关(crossbar)互连由一组纵横开关阵列组成,将横向的p个处理机P及i个I/O模块与纵向的m个存储器模块M连接起来。每个处理机和I/O设备都能分到一套总线与某个存储器相连,从而大大加宽互连传输带宽,提高系统效率,与总线互连中采用分时使用总线不同,交叉开关采用的是空间分配机制3.多级网络互连方式的动态连接网络是将多套单级互连网络通过开关模块串联扩展成多级互连网络(MultistageInterconnectonNetwork)。与单级网络相比,多级网络可以通过改变开关的控制方式灵活的实现各种互连。常见多级互连网络:多级立方体网络多级混洗交换网络多级PM2I网络基准网络多级CLOS网络多级BENES可重排网络4.蝶式网络多级蝶式网络是用交叉开关将单级蝶式网络连成模块构成的,图5.36所示是两个规模不同的蝶式网络。图5.36(a)是一个由16个8×8交叉开关构成的两级64×64蝶式网络,级间采用8路混洗连接;图5.36(b)是有512个输入端的三级蝶式网络结构,同样也由8×8交叉开关构成。图5.36(b)中的每个64×64方框相当于图5.36(a)中的两级蝶式网络。图5.36(a)中的两级蝶式网络共用了16个8×8交叉开关,图5.36(b)中的三级蝶式网络共用了3×8×8=192个8×8交叉开关。用这种模块结构构造更大的蝶式网络只要增加级数即可。5.3几种典型的并行处理机5.3.1ILLIAC-IV阵列处理机ILLIAC-IV是由美国伊里诺依大学研制,Burroughs公司主产的阵列处理机,采用分布式局部存储器结构,处理单元之间采用网格状网络互连。系统使用了一个CU,控制64个PE,速度约2亿次/s运算。这种处理机主要用于像天气预报、核物理工程研究及其他需要高速科学计算的应用领域。ILLIAC-IV系统的组成如图5.37所示。它实际上是由三种类型处理机组成的一个异构多机系统:一是用于数组运算的处理单元PE阵列;二是阵列控制器CU,它既是处理单元阵列的控制部分,又是一台相对独立的小型标量处理机;三是一台B6500计算机,它担负整个系统的管理,包括操作系统、汇编程序、编译程序、输入/输出服务子程序等都驻留在B6500中。控制处理单元阵列被看做是宿主机专用于向量处理的后端机。5.3.2BSP计算机BSP是美国Burroughs公司和伊里诺大学合作设计的用于科学计算的并行处理机,采用共享集中式主存结构,最高处理速度足5000万次每秒浮点运算。BSP计算机系统组成如图5.38所示,它由系统管理计算机B7700/B7800和BSP处理机两大部分组成,前者可视为后者的前端机。系统管理机负责BSP程序编译、与远程终端及网络的数据通信、外围设备管理等任务,大多数BSP作业调度和操作系统活动也是在系统管理机上完成的。BSP处理机又可分为三部分:一是并行处理机,二是控制处理机,三是容量为4M字~64M字的文件存储器。本章小结并行处理机也称为阵列处理机。它是通过重复设置大量相同的处理单元PE,在单一控制部件CU控制下,对各自分配的不同数据并

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档