高性能计算和高性能计算机-Read.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高性能计算和高性能计算机-Read.ppt

高性能计算和高性能计算机 赵崇山 2007-08-10 目 录 并行计算概要 高性能计算机体系结构 并行编程简介 高性能计算机群 并行计算的应用模式 环境科学 全球气候 污染输运 公共安全与管理 燃烧 现象 城市交通模拟 工程 多物理尺度的问题 流体力学(CFD) 结构力学(CAE) 生物学 药物设计 基因学 实验有争议 应用物理 新材料设计 辐射传输 宇宙演化 数值 模拟 实验危险 实验困难 实验昂贵 不可能进行实验 计算是认识世界的主要手段 并行计算的功能 降低单个问题求解的时间 增加问题求解规模、提高问题求解精度 (多机同时执行多个串行程序)容错、更高的可用性、提高吞吐率 并行计算的应用需求 并行化的主要方法:分而治之 根据问题的求解过程,把任务分成若干子任务(任务级并行或功能并行) 根据处理数据的方式,形成多个相对独立的数据区,由不同的处理器分别处理(数据并行) 如何实现并行计算? 分而治之! 目 录 并行计算概要 高性能计算机体系结构 并行编程简介 高性能计算机群 并行计算的应用模式 由众多部件组成,具有运算速度快、存储容量大、可靠性高的特性。 也称为:超级计算机、高端计算机、高性能计算机 目前任何高性能计算机和并行计算都离不开使用并行技术,所以高性能计算机肯定是并行计算机。 定义:并行计算机 衡量并行计算机的标准 TOP500排名标准依据Linpack软件实际测试值所表现出来的浮点计算能力 超级计算机总装机量排名 并行计算机系统结构 Flynn分类: SISD, SIMD, MIMD, MISD 结构模型: PVP, SMP, MPP, DSM, COW 访存模型: UMA, NUMA, COMA, CC-NUMA, NORMA Flynn分类 Flynn(1972)提出指令流、数据流和多倍性概念,把不同的计算机分为四大类: SISD(Single-Instruction Single-Data) SIMD(Single-Instruction Multi-Data) MISD(Multi-Instruction Single-Data) MIMD(Multi-Instruction Multi-Data) 超级计算机肯定是属于MIMD。MIMD从结构上和访存方式上,又可以分为: 结构模型:PVP, SMP, MPP, DSM, CLUSTER 访存模型:UMA, NUMA, COMA, CC-NUMA, NORMA Flynn分类 并行计算机体系结构分类 分布共享存储系统(DSM) 通过硬件来实现内存统一编址的超级计算机 SGI Altix 4000系列和Origin 3000系列 大规模并行计算机系统(MPP) 采用专用定制的网络连接或结构的超级计算机 Cray “红色风暴” ,IBM SP4 ,IBM “蓝色基因” 机群系统(Cluster) 通过定制/标准网络连接的超级计算机 曙光TC4000系列,联想深腾6800 体系结构模型分类 SMP 对称式共享存储:任意处理器可直接访问任意内存地址,且访问延迟、带宽、机率都是等价的; 系统是对称的; 处理器: 一般少于64个; 处理器不能太多, 总线和交叉开关的一旦作成难于扩展; 例子:SUN Enterprise, 曙光1号,IBM RS6000,HP SuperDome 对称多处理机系统(SMP) 分布共享存储系统(DSM) DSM: 分布共享存储: 内存模块物理上局部于各个处理器内部,但逻辑上(用户)是共享存储的; 这种结构也称为基于Cache目录的非一致内存访问(CC-NUMA)结构;局部与远程内存访问的延迟和带宽不一致,3-10倍?高性能并行程序设计注意 与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形成一个共享的存储器 处理器: 可扩展性比较好 代表: SGI Origin 3000, Altix 4700 , Cray T3D 大规模并行计算机系统(MPP) MPP 物理和逻辑上均是分布内存 能扩展至成百上千个处理器(微处理器或向量处理器) 采用高通信带宽和低延迟的互联网络 (专门设计和定制的) 一种异步的MIMD机器;程序系由多个进程组成,每个都有其私有地址空间,进程间采用传递消息相互作用; 代表: 曙光1000 ,神威机系列,CRAY T3E, ASCI Red(3072), IBM SP4, CRAY RedStorm,IBM Blue Gene Cluster 每个节点都是一个完整的计算机 各个节点通过高性能网络相互连接 网络接口和I/O总线松耦合连接 每个节点有完整的操作系统 曙光2000、 3000、4000, ASCI Blue Mountain 机群系统(Cluster) 访存模型分类 多处理机 (共享存储)

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档