网站大量收购闲置独家精品文档,联系QQ:2885784924

算法设计与-2范例.ppt

  1. 1、本文档共163页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
并行算法加速比与阿姆达尔定律 E.g. 计算机游戏中 的图形渲染 * 渲染:为场景中对象/图元增加颜色、亮度、纹理 游戏引擎与光线渲染 场景中图元 → 渲染后的物体 3D Max三维建模 阿姆达尔定律 阿姆达尔(Amdahl ): IBM360系列机的主要设计者 阿姆达尔定律 系统中对某一部件采用更快执行方式(e.g. 并行处理)所能获得的系统性能改进程度,取决于这种执行方式被使用的频率,或所占总执行时间的比例 该定律定义了采取增强(加速)某部分功能处理的措施后,可获得的性能改进或执行时间的加速比 结论:通过更快的处理器来获得加速受限于慢的系统组件 阿姆达尔定律 在固定负载情况下,加速比SP a: 串行计算部分所占比例,n: 并行处理结点个数 当a=0时,可完全并行化,最大加速比s=n; 当a=1时,无法并行化,最小加速比s=1; 当n→∞时,分解后的子问题数目、并行计算节点数目趋于无穷大,极限加速比s→ 1/a——加速比的上限; 阿姆达尔定律 对采用“分解——并行求解——合并”机制的并行算法,分解、合并部分所占时间越少,可达到的并行加速比越大! E.g. 合并排序:分解简单,合并复杂 快速排序:分解复杂,合并简单 E.g. 若串行代码占整个代码的25%,即a=25%,则并行处理的总体性能不可能超过4 * 欢迎辞 * * 大型客机C919飞机流场计算 航空发动机的数值模拟分析与优化设计 吊舱式推进器水动力性能预报技术研究 桨舵干扰的研究 某汽车公司新车型研发过程中整车安全 验证分析及优化 某重型卡车结构强度/疲劳寿命及振动噪 声分析 钢铁领域:多辊矫直机辊系结构有限元分析 材料加工 研究课题:新型管壳式换热器成型及流动传热模拟 关于盆地地质沉降演化实验成果。通过模拟实验 土木市政领域 研究课题:隧道结构与轨道车辆耦合系统振动分析 复杂流动发声机理的大涡模拟研究 室内 三维立体覆盖分析 移动通信网络,e.g. GSM,立体信号覆盖 三维立体覆盖 室内信号泄漏 中国正在研制史上性能最强大的超级计算机。 采用英特尔最新Ivy Bridge架构的至强E5处理器和至强Phi协处理器,总数量高达10万片 计算能力高达100 PFLOPS=10亿亿flops ——比2011年度最快超级计算器快10倍 在航天、城市规划、医疗等许多领域发挥巨大的作用 超级计算机将被安置在西南某城市,硬件部分耗资数亿美元 英特尔提供了最新至强E5-2567W v2处理器(2500美元/颗)、至强Phi 5110P with8GB GDDR5协处理器(2649美元/片),光是这两种芯片的总价就超过了5亿美元 1 PFlops:每秒1千万亿浮点运算 2013中国超级计算机TOP10排行榜 2013中国超级计算机TOP10排行榜 2013中国超级计算机TOP100排行榜 2013中国超级计算机TOP100排行榜 并行计算/并行算法与超级计算 并行计算(Parallel Computing): 串行计算 并行计算: 利用多个部件 共同完成 计算任务 如何实现并行计算 如何实现并行计算 算法设计——程序设计实现(programing)——计算机上的程序运行求解 复杂问题求解: 1. 并行算法设计 2. 并行程序设计实现 3. 并行计算机/高性能计算机/超级计算机上的并行程序运行求解 并行算法设计策略: 经常采用 “分治策略” 并行计算方法 寻找并行性 并行算法设计的四个步骤 1. 划分 – 数据分解或功能分解 2. 通信 – 确定通信模式(局部/全局),负载均衡, 3. 聚集 – 依据计算机规模聚合并行化,最小化并行开销,可扩展性 4. 映射 – 将任务分配给处理器 Partition 分解 分解,即将大规模的计算量分解成小份task – 区域分解domain decomposition – 任务分解functional decomposition 注意事项check list – task数至少比并行处理器数目多 – 每个task对应的计算量相当 – 分解task数目要和问题规模相对应 – 分解需要尽可能的避免不必要的通讯/存储 Communication 通讯 每个子task可以同时(concurrency)在不同处理 器上计算,但是无法避免子task间交换数据 – 区域分解:task间通讯比较难分析 – 任务分解:task间通讯直接,即task的数据流 Communication注意事项check list – 子task间通讯平衡 – 任务间的全局通讯 – 计算和通讯尽量能

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档