计算机系统结构第5章互连网络.pptVIP

  1. 1、本文档共221页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多处理机总线互连 用一组导线和插座将处理机、存储模块和各种外围设备互连起来,总线上的各模块需要通信时,发出申请,由总线仲裁逻辑对多个请求进行仲裁,进行总线服务分配。 总线上各模块通过争用或时分方式获得总线服务。 价格较低,带宽较窄 可扩展的总线一般用硬件来支持高速缓存一致性、快速多处理器同步以及事务的中断处理 多级蝶式网络 SIMD计算机的两种基本结构 分布式存储器SIMD计算机基本结构 SIMD计算机是由单一控制部件控制多个处理单 元同时进行运算操作,所有处理单元通常通过互 连网络构成阵列,它们均接收从控制部件广播来 的同一条指令,但操作对象是不同的数据。 SIMD计算机的结构可概括为5个字: 运:运算器阵列(处理单元阵列)PE1~PEn 控:控制器CU,解释向量指令并驱动处理单元 阵列操作,还能独立完成标量运算 存:存储器,每个PE的局部存储器LM或PE阵 列共享的多体并行存储器SM 管:管理计算机,专门进行输入输出和运行操 作系统的管理功能 网:互连网络,提供处理单元阵列或存储器阵 列成员间并行交换数据的高速通路 分布式存储器SIMD结构 并行处理机(运) 执行程序中的向量运算和数组运算,所有PE在统一的CU控制下并行操作,可用屏蔽逻辑决定任何PE在给定的指令周期执行或不执行指令 局部存储器(存) 每个PE有自己的可直接访问的局部存储器,其它PE的局部存储器称远程存储器 阵列控制部件(控) 执行程序流控制指令和程序中的标量运算,控制PE间的同步和并行操作,通过执行程序控制数据寻径网络 控制存储器 存放系统程序、用户程序和标量数据 管理处理机SC(管): 运行操作系统,管理系统资源 互连网络(网): 执行PE间的通信,互连网络的连接确定了处理单元连接的拓扑结构,从而决定了并行处理机能适应的并行算法;CU通过执行程序控制数据寻径网络 集中式共享存储器SIMD结构 多体并行存储器(存): n个PE共享由m个存储体组成的并行存储器,从而实现数据的共享。 m≥n,PE和存储体间通过互连网络相连。为实现对二维数组的无冲突访问,应使m和n互质,数组元素在存储体中错位存储。 互连网络(网): 连接各PE和各存储体,是存储体和PE间的必由之路。数据寻径指令包括数据置换,广播,选播以及多种循环和移数操作。 处理单元(运): 在CU控制下并行操作,可通过屏蔽操作允许或禁止某些PE参加运算。 主机/管理处理机(管): 用于用户程序的汇编及向量化编译,完成系统维护、输入输出、大容量存储器的管理、作业调度、文件管理等操作系统功能 阵列控制部件(控): 在CU协调下,标量处理机与PE阵列并发运算 SIMD计算机的主要特点 SIMD计算机是按照功能专门化原则发展起来的一种异构型多处理机系统。 处理单元阵列:专门进行向量或数组运算 控制处理机:专门进行标量运算和处理 管理处理机:专门进行输入/输出和运行操作系统 CU应具备高性能的标量处理能力,系统应有高性能的向量化编译程序以及运行此编译程序和操作系统的管理处理机SC SIMD计算机的特点 SIMD计算机的效率取决于计算程序向量化的程度。 专用性较强 采用资源重复,速度快,提高速度的潜力大 依赖于互连网络和并行算法,互连网络规定了处理单元的连接模式,决定了SIMD计算机能适应的算法类别 依赖于标量运算速度和编译过程的时间开销 SIMD计算机可看成是根据功能专用化原则组成的一种异构型多计算机系统 ILLIAC IV计算机系统 处理单元阵列 专门进行向量或数组运算 阵列控制器 控制处理单元阵列,又可进行标量运算 Burroughs B6700计算机 担负ILLIAC IV输入输出系统和操作系统管理功能 ILLIAC IV阵列 ILLIAC IV阵列由64个处理单元PEi、64个处理单元存储器PEMi和存储器逻辑部件MLU组成 PEi与(i+1)mod 64, (i-1)mod 64, (i+8)mod 64, (i-8)mod 64 直接相连 PM2±0(x)=(x±20) mod N PM2±3(x)=(x±23) mod N 任意一对PE间的距离≤7 ILLIAC IV的并行算法 矩阵加 例如两个8*8的矩阵A和B相加,只需把A和B同一位置的一对元素放在同一PEM内,64个PE可同时并行地完成64对元素的相加,处理速度为顺序处理的64倍 矩阵乘 例1 阵列处理机和向量流水处理机的区别 Illiac IV 系统总框图 处理单元阵列 阵

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档