- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高性能计算和高性能计算机-Read.ppt
高性能计算和高性能计算机
赵崇山
2007-08-10
目 录
并行计算概要
高性能计算机体系结构
并行编程简介
高性能计算机群
并行计算的应用模式
环境科学
全球气候
污染输运
公共安全与管理
燃烧 现象
城市交通模拟
工程
多物理尺度的问题
流体力学(CFD)
结构力学(CAE)
生物学
药物设计
基因学
实验有争议
应用物理
新材料设计
辐射传输
宇宙演化
数值
模拟
实验危险
实验困难
实验昂贵
不可能进行实验
计算是认识世界的主要手段
并行计算的功能
降低单个问题求解的时间
增加问题求解规模、提高问题求解精度
(多机同时执行多个串行程序)容错、更高的可用性、提高吞吐率
并行计算的应用需求
并行化的主要方法:分而治之
根据问题的求解过程,把任务分成若干子任务(任务级并行或功能并行)
根据处理数据的方式,形成多个相对独立的数据区,由不同的处理器分别处理(数据并行)
如何实现并行计算?
分而治之!
目 录
并行计算概要
高性能计算机体系结构
并行编程简介
高性能计算机群
并行计算的应用模式
由众多部件组成,具有运算速度快、存储容量大、可靠性高的特性。
也称为:超级计算机、高端计算机、高性能计算机
目前任何高性能计算机和并行计算都离不开使用并行技术,所以高性能计算机肯定是并行计算机。
定义:并行计算机
衡量并行计算机的标准
TOP500排名标准依据Linpack软件实际测试值所表现出来的浮点计算能力
超级计算机总装机量排名
并行计算机系统结构
Flynn分类:
SISD, SIMD, MIMD, MISD
结构模型:
PVP, SMP, MPP, DSM, COW
访存模型:
UMA, NUMA, COMA, CC-NUMA, NORMA
Flynn分类
Flynn(1972)提出指令流、数据流和多倍性概念,把不同的计算机分为四大类:
SISD(Single-Instruction Single-Data)
SIMD(Single-Instruction Multi-Data)
MISD(Multi-Instruction Single-Data)
MIMD(Multi-Instruction Multi-Data)
超级计算机肯定是属于MIMD。MIMD从结构上和访存方式上,又可以分为:
结构模型:PVP, SMP, MPP, DSM, CLUSTER
访存模型:UMA, NUMA, COMA, CC-NUMA, NORMA
Flynn分类
并行计算机体系结构分类
分布共享存储系统(DSM)
通过硬件来实现内存统一编址的超级计算机
SGI Altix 4000系列和Origin 3000系列
大规模并行计算机系统(MPP)
采用专用定制的网络连接或结构的超级计算机
Cray “红色风暴” ,IBM SP4 ,IBM “蓝色基因”
机群系统(Cluster)
通过定制/标准网络连接的超级计算机
曙光TC4000系列,联想深腾6800
体系结构模型分类
SMP
对称式共享存储:任意处理器可直接访问任意内存地址,且访问延迟、带宽、机率都是等价的; 系统是对称的;
处理器: 一般少于64个;
处理器不能太多, 总线和交叉开关的一旦作成难于扩展;
例子:SUN Enterprise, 曙光1号,IBM RS6000,HP SuperDome
对称多处理机系统(SMP)
分布共享存储系统(DSM)
DSM:
分布共享存储: 内存模块物理上局部于各个处理器内部,但逻辑上(用户)是共享存储的; 这种结构也称为基于Cache目录的非一致内存访问(CC-NUMA)结构;局部与远程内存访问的延迟和带宽不一致,3-10倍?高性能并行程序设计注意
与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形成一个共享的存储器
处理器: 可扩展性比较好
代表: SGI Origin 3000, Altix 4700 , Cray T3D
大规模并行计算机系统(MPP)
MPP
物理和逻辑上均是分布内存
能扩展至成百上千个处理器(微处理器或向量处理器)
采用高通信带宽和低延迟的互联网络 (专门设计和定制的)
一种异步的MIMD机器;程序系由多个进程组成,每个都有其私有地址空间,进程间采用传递消息相互作用;
代表:
曙光1000 ,神威机系列,CRAY T3E, ASCI Red(3072), IBM SP4, CRAY RedStorm,IBM Blue Gene
Cluster
每个节点都是一个完整的计算机
各个节点通过高性能网络相互连接
网络接口和I/O总线松耦合连接
每个节点有完整的操作系统
曙光2000、 3000、4000, ASCI Blue Mountain
机群系统(Cluster)
访存模型分类
多处理机
(共享存储)
原创力文档


文档评论(0)