并行计算基础知识.ppt

下载文档 降价啦

2
0
约5.23千字
约 65页
2022-03-16 发布于广东
举报
版权申诉
保障服务

并行计算基础知识.ppt

1、本文档共65页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

十年来CPU演变（3）十年来体系结构的演变机群：厂家面临的问题怎样避免同质化？一样的CPU、一样的网络、一样的操作系统、几乎一样的机群系统不一样的用户需求，一样的系统能最优满足？ SUMA标准 Scalability 可扩展性 Usability 易用性 Manageability 可管理性 Availability 高可用性怎样避免同质化应用分类 CPU密集、MEM密集、DISK密集、NIC密集针对不同应用需求，提出不同的方案可重构计算 Intel与AMD Opteron 与32位兼容的64位处理器 HyperTransport Xeon 主频持续上升 Itanium ？华大基因（北京） Draft Sequence of Rice Genome 曙光百万亿数据处理超级服务器 4000L主要指标 40个机柜组成 644个CPU 每秒3万亿次浮点计算峰值速度 644GB内存百万亿字节（100TB）存储最大可“在线”扩展到80个机柜 1300个CPU 每秒6.75万亿次峰值速度 4000G内存 600T存储 1200A最大电流，160千瓦最大功耗的海量处理系统初步的面向网格的特点 Grid Terminal智能控制台能够实现庞大系统的安全管理 GridView网格监控中心软件则提供了逻辑视角、视角的可伸缩性、历史记录分析三项特色，被称为系统的“千里眼”。中国近期的一些新闻曙光“红色网格”孕育10万亿次超级计算机中科院网络信息中心委托联想研制高性能计算机系统高性能计算的“超级”对抗浪潮高性能计算生命科学领域显奇功高性能计算：处于什么样的阶段？ HPC：处于什么样的阶段机群高性能计算系统已经成熟，步入量产阶段国内曙光、联想、浪潮，还有大量小公司高性能计算应用的快速扩展阶段从去年开始，机群销量猛增，应用在科学计算和信息服务等所有领域高性能计算教育相对滞后、人才相对稀缺阶段北大、清华、科大等有限几所高校设置相应专业课程并行计算基本概念并行算法的定义与分类并行算法的复杂性数据相关性与可并行化并行计算模型并行算法的定义与分类算法是解题的精确描述，是一组有穷的规则，它规定了解决某一特定类型问题的一系列运算。并行计算时可同时求解的诸进程的集合，这些进程相互作用和协调动作，并最终获得问题的求解并行算法就是对并行计算过程的精确描述并行算法可以从不同的角度分类为数值计算并行算法和非数值计算并行算法同步并行算法和异步并行算法共享存储并行算法和分布存储并行算法数值算法与非数值算法数值计算是指基于代数关系运算的计算问题，如矩阵运算、多项式求值、线性代数方程组求解等。求解数值计算问题的算法称为数值算法（Numerical Algorithm）。科学与工程中的计算问题如计算力学、计算物理、计算化学等一般是数值计算问题。非数值计算是指基于比较关系运算诸如排序、选择、搜索、匹配等符号处理，相应的算法也称为非数值算法（Non-numerical Algorithm）。非数值计算在符号类信息处理中获得广泛应用，如数据库领域的计算问题、海量数据挖掘等，近年来广泛关注的生物信息学主要也是非数值计算并行算法的复杂性上界 f(n)=cg(n)，则称g(n)是f(n)的一个上界，记做f(n)=O(g(n)) 下界 f(n)=cg(n)，则称g(n)是f(n)的一个下界，记做f(n)=Ω(g(n)) 紧致界 c1g(n)=f(n)=c2g(n)，则称g(n)是f(n)的一个紧致界，记做f(n)=Θ(g(n))。描述并行算法如果要求输入输出N个数据，则认为该算法的I/O时间界为O(N) 如果问题规模为n，涉及的计算量一般为t(n)，则该算法的计算CPU时间界为O(t(n) 对要求通信和同步的次数为L、通信量为M个数据，则该算法的并行开销为O(L+M) 问题规模问题规模有可分为输入输出规模、计算规模、内存需求、通信（同步）规模，分别表示问题求解所需要的I/O量、计算量、内存大小和通信量（包括通信次数与通信数据量）。根据消耗资源程度，又相应分为 CPU密集应用、memory密集应用、disk密集应用和网络密集应用。不同类型的问题，性能瓶颈也往往不同。并行算法就是要又针对性的消除相应的瓶颈，从而达到缩短计算时间的目的。相关性与可并行化伯恩斯坦准则 I1∩O2＝Φ，即P1的输入变量集与P2的输出变量集不相交； I2∩O1＝Φ，即P2的输入变量集与P1的输出变量集不相交； O1∩O2＝Φ，即P1和P2的输出变量集不相交可并行处理数据相关 P1： A＝B+C P2： D＝A×B 其中，变量A是导致P1和P2发生数据相关的原因。为了保证程序执行的语义