算法设计与-2范例.ppt

下载文档 降价啦

6
0
约2.91万字
约 163页
2017-03-14 发布于湖北
举报
版权申诉
保障服务

算法设计与-2范例.ppt

1、本文档共163页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

并行算法加速比与阿姆达尔定律 E.g. 计算机游戏中的图形渲染 * 渲染：为场景中对象/图元增加颜色、亮度、纹理游戏引擎与光线渲染场景中图元 → 渲染后的物体 3D Max三维建模阿姆达尔定律阿姆达尔(Amdahl ): IBM360系列机的主要设计者阿姆达尔定律系统中对某一部件采用更快执行方式（e.g. 并行处理）所能获得的系统性能改进程度，取决于这种执行方式被使用的频率，或所占总执行时间的比例该定律定义了采取增强（加速）某部分功能处理的措施后，可获得的性能改进或执行时间的加速比结论：通过更快的处理器来获得加速受限于慢的系统组件阿姆达尔定律在固定负载情况下，加速比SP a: 串行计算部分所占比例，n: 并行处理结点个数当a=0时，可完全并行化，最大加速比s=n；当a=1时，无法并行化，最小加速比s=1；当n→∞时，分解后的子问题数目、并行计算节点数目趋于无穷大，极限加速比s→ 1/a——加速比的上限；阿姆达尔定律对采用“分解——并行求解——合并”机制的并行算法，分解、合并部分所占时间越少，可达到的并行加速比越大！ E.g. 合并排序：分解简单，合并复杂快速排序：分解复杂，合并简单 E.g. 若串行代码占整个代码的25%，即a=25%，则并行处理的总体性能不可能超过4 * 欢迎辞 * * 大型客机C919飞机流场计算航空发动机的数值模拟分析与优化设计吊舱式推进器水动力性能预报技术研究桨舵干扰的研究某汽车公司新车型研发过程中整车安全验证分析及优化某重型卡车结构强度/疲劳寿命及振动噪声分析钢铁领域：多辊矫直机辊系结构有限元分析材料加工研究课题：新型管壳式换热器成型及流动传热模拟关于盆地地质沉降演化实验成果。通过模拟实验土木市政领域研究课题：隧道结构与轨道车辆耦合系统振动分析复杂流动发声机理的大涡模拟研究室内三维立体覆盖分析移动通信网络，e.g. GSM，立体信号覆盖三维立体覆盖室内信号泄漏中国正在研制史上性能最强大的超级计算机。采用英特尔最新Ivy Bridge架构的至强E5处理器和至强Phi协处理器，总数量高达10万片计算能力高达100 PFLOPS=10亿亿flops ——比2011年度最快超级计算器快10倍在航天、城市规划、医疗等许多领域发挥巨大的作用超级计算机将被安置在西南某城市，硬件部分耗资数亿美元英特尔提供了最新至强E5-2567W v2处理器(2500美元/颗)、至强Phi 5110P with8GB GDDR5协处理器(2649美元/片)，光是这两种芯片的总价就超过了5亿美元 1 PFlops：每秒1千万亿浮点运算 2013中国超级计算机TOP10排行榜 2013中国超级计算机TOP10排行榜 2013中国超级计算机TOP100排行榜 2013中国超级计算机TOP100排行榜并行计算/并行算法与超级计算并行计算(Parallel Computing)：串行计算并行计算：利用多个部件共同完成计算任务如何实现并行计算如何实现并行计算算法设计——程序设计实现(programing)——计算机上的程序运行求解复杂问题求解： 1. 并行算法设计 2. 并行程序设计实现 3. 并行计算机/高性能计算机/超级计算机上的并行程序运行求解并行算法设计策略：经常采用 “分治策略” 并行计算方法寻找并行性并行算法设计的四个步骤 1. 划分 – 数据分解或功能分解 2. 通信 – 确定通信模式(局部/全局),负载均衡, 3. 聚集 – 依据计算机规模聚合并行化,最小化并行开销,可扩展性 4. 映射 – 将任务分配给处理器 Partition 分解分解，即将大规模的计算量分解成小份task – 区域分解domain decomposition – 任务分解functional decomposition 注意事项check list – task数至少比并行处理器数目多 – 每个task对应的计算量相当 – 分解task数目要和问题规模相对应 – 分解需要尽可能的避免不必要的通讯/存储 Communication 通讯每个子task可以同时(concurrency)在不同处理器上计算，但是无法避免子task间交换数据 – 区域分解：task间通讯比较难分析 – 任务分解：task间通讯直接，即task的数据流 Communication注意事项check list – 子task间通讯平衡 – 任务间的全局通讯 – 计算和通讯尽量能