并行计算基础的.pptVIP

下载本文档

1
0
约8.96千字
约 47页
2017-08-22 发布于湖北
举报
版权申诉

并行计算基础的.ppt

1、本文档共47页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

并行计算基础的

北京大学二零零八年春季 *致谢：感谢Intel对本课程项目的资助本讲主要内容并行计算机体系结构并行计算模型进程线程并行编程环境编程语言与编译器并行计算性能评测常用并行数值算法并行编译器并行计算机体系结构组成并行计算机的各个部分为：节点（node）：每个节点由多个处理器构成，可以直接输入输出互联网络（interconnect network）：所有节点通过互联网络相互连接通信。内存（memory）：内存由多个存储模块组成，这些模块或者与节点对称地分布在互联网络的两侧，或者位于各个节点的内部多级存储体系结构微处理器的峰值运算速度每18个月翻一番内存模块的容量每年几乎翻一番内存模块的访问速度却没有得到平衡发展内存的访问速度要比处理器执行速度慢很多内存墙性能瓶颈 =〉多级存储结构多级存储体系结构并行计算机访存模型 UMA（Uniform Memory Access）模型内存模块与节点分离，分别位于互联网络两侧物理存储器被所有节点共享所有节点访问任意存储单元的时间相同发生访存竞争时，仲裁策略平等对待每个节点各节点的CPU可带有局部私有高速缓存外围I/O设备也可以共享，且每个节点有平等的访问权利并行计算机访存模型 NUMA（Non-Uniform Memory Access）模型内存模块分布在各个节点内部物理存储器被所有节点共享，任意节点可以直接访问任意内存模块节点访问内存模块的速度不同发生访存竞争时，仲裁策略对节点可能是不等价的各节点的CPU可带有局部私有高速缓存外围I/O设备也可以共享，但对各节点是不等价的并行计算机访存模型 COMA（Cache-Only Memory Access）模型各处理器节点中没有存储层次结构利用分布的高速缓存目录进行远程高速缓存的访问 COMA中的高速缓存容量一般都大于2级高速缓存容量数据开始时可以任意分配，在运行时它最终会被迁移到要用到它的地方并行计算机访存模型 NORMA（No-Remote Memory Access）模型所有存储器都是私有的绝大多数NORMA都不支持远程存储器访问并行计算模型 SIMD同步并行计算模型 SIMD共享存储模型；并行随机存取机器假定存在着一个容量无限大的共享存储器有有限或无限个功能相同的处理器均具有简单的算术运算和逻辑判断功能在任何时刻各处理器均可通过共享存储单元相互交换数据 SIMD同步并行计算模型 SIMD分布存储模型，常见模型有：采用一维线性连接的SIMD模型采用网孔连接的SIMD模型采用树形连接的SIMD模型采用树网连接的SIMD模型采用立方连接的SIMD模型采用立方环连接的SIMD模型采用洗牌交换连接的SIMD模型采用多级互联网络连接的SIMD模型 MIMD异步并行计算模型异步PRAM模型每个处理器都有其本地存储器、局部时钟和局部程序处理器间的通信经过共享全局存储器无全局时钟，各处理器异步地独立执行各自的指令处理器任何时间依赖关系需明确地在各处理器的程序中加入同步（路）障一条指令可在非确定但有限的时间内完成 MIMD异步并行计算模型 BSP模型计算由一系列用全局同步分开的周期为L的超级步（superstep）组成在各超级步中: 每个处理器均执行局部计算通过路由器接受和发送消息然后做一全局检查，以确定该超级步是否已由所有的处理器完成若是，则前进到下一超级步否则下一L周期被分配给未曾完成的超级步 MIMD异步并行计算模型 LogP模型一种分布存储的、点到点通信的多处理机模型其中通信网络由一组参数来描述: L （Latency）表示消息从源到目的在网络上的延迟 o （overhead）表示处理器发送或接受一条消息消耗在网络协议栈中的开销 g （Gap）表示处理器可连续进行消息发送或接受的最小时间间隔 P （Processor）表示处理器/存储器模块数 MIMD异步并行计算模型 C3（Computation, Communication, Congestion）模型一个与体系结构无关的粗粒度的并行计算模型强调用公用的通信操作来开发粗粒度的并行算法考虑到了网络链路拥挤和处理器拥挤对并行算法性能的影响进程进程的定义进程（process）可表示成四元组（P, C, D, S） P是程序代码 C是进程的控制状态 D是进程的数据 S是进程的执行状态进程的状态非存在状态：进程依赖的程序还没有投入运行就绪状态：进程由其父进程调入并准备运行运行状态：进程占有CPU和其它必