中科大-并行计算讲义-并行计算机系统与结构模型概述.ppt

中科大-并行计算讲义-并行计算机系统与结构模型概述.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代密码学理论与实践之五 并行算法实践 上篇 并行程序设计导论 并行算法实践 上篇 并行程序设计导论 单元I 并行程序设计基础 单元II 并行程序编程指南 单元III 并行程序开发方法 单元I 并行程序设计基础 第一章 并行计算机系统与结构模型 第二章 PC机群的搭建 第三章 并行程序设计简介 第一章 并行计算机系统与结构模型 1.1 典型并行计算机系统简介 1.1.1 阵列处理机 1.1.2 向量处理机 1.1.3 共享存储多处理机 1.1.4 分布存储多计算机 1.1.5 分布共享存储多处理机 1.2 当代并行计算机体系结构 1.2.1 并行计算机体系结构模型 1.2.2 并行计算机存储结构模型 1.2.3 分布式高速缓存与主存体系结构 1.3 小结 典型并行计算机系统 阵列处理机 向量处理机 共享存储多处理机 分布存储多计算机 阵列处理机的两种基本结构 阵列处理机的特点 SIMD-单指令多数据流机 利用资源重复开拓计算空间的并行 同步计算--所有PE执行相同操作 适于特定问题(如有限差分、矩阵运算等)求解 Cray-1的向量处理 共享存储的多处理机 MIMD-多指令多数据流机 单一的共享地址空间 易于编程、难于扩展 存储访问可成为性能瓶颈 紧耦合与同构对称方式 典型的紧耦合多处理机系统 Balance同构对称多处理机系统 分布存储多计算机 松散耦合多机系统 节点独立(可有局存、IO设备等) 易于扩展 多地址空间 消息传递通信界面 难于编程 Intel Paragon系统框图 分布共享存储多处理机 分布共享存储DSM-Distributed Shared Memory 将物理上分布的存储系统,通过硬件和软件的办法,向用户提供一个单一的全局地址空间 易于编程 易于扩展 并行计算机体系结构 单指令多数据流机SIMD(Single-Instruction Multiple-Data); 并行向量处理机PVP(Parallel Vector Processor); 对称多处理机SMP(Symmetric Multiprocessor); 大规模并行处理机MPP(Massively Parallel Processor); 工作站机群COW(Cluster of Workstation) 分布式共享存储DSM(Distributed Shared Memory)多处理机。 并行计算机体系结构模型 对称多处理机SMP(1) SMP: 采用商用微处理器,通常有片上和片外Cache,基于总线连接,集中式共享存储,UMA结构 例子:SGI Power Challenge, DEC Alpha Server,Dawning 1 对称多处理机SMP(2) 优点 对称性 单地址空间,易编程性,动态负载平衡,无需显示数据分配 高速缓存及其一致性,数据局部性,硬件维持一致性 低通信延迟,Load/Store完成 问题 欠可靠,BUS,OS,SM 通信延迟(相对于CPU),竞争加剧 慢速增加的带宽(MB double/3年,IOB更慢) 不可扩放性---〉CC-NUMA 大规模并行机MPP 成百上千个处理器组成的大规模计算机系统,规模是变化的。 NORMA结构,高带宽低延迟定制互连。 可扩放性:Mem, I/O,平衡设计 系统成本:商用处理器,相对稳定的结构,SMP,分布 通用性和可用性:不同的应用,PVM,MPI,交互,批处理,互连对用户透明,单一系统映象,故障 通信要求 存储器和I/O能力 例子:Intel Option Red IBM SP2 Dawning 1000 典型MPP系统特性比较 机群型大规模并行机SP2 设计策略: 机群体系结构 标准环境 标准编程模型 系统可用性 精选的单一系统映像 系统结构: 高性能开关 HPS 多级Ω网络 宽节点、窄节点和窄节点2 工作站机群COW 分布式存储,MIMD,工作站+商用互连网络,每个节点是一个完整的计算机,有自己的磁盘和操作系统,而MPP中只有微内核 优点: 投资风险小 系统结构灵活 性能/价格比高 能充分利用分散的计算资源 可扩放性好 问题 通信性能 并行编程环境 例子:Berkeley NOW,Alpha Farm, FXCOW 典型的机群系统 SMP\MPP\机群比较 五种结构特性一览表 并行计算机访存模型 均匀存储访问模型- UMA 非均匀存储访问模型- NUMA 全高速缓存访问模型-COMA 高速缓存一致性非均匀存储访问模型-CC-NUMA 非远程存储访问模型-NORMA UMA访存模型 UMA(Uniform Memory Access)模型是均匀存储访问模型的简称。其特点是: 物理存储器

文档评论(0)

金不换 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档