第3章 性能分析.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 性能分析 并行性的基本概念 阿姆达尔定律 并行结构 性能协调 性能指标 第二种方法:用多台计算机协同求解一个问题。 整个求解问题被划分成若干部分,然后每个部分各由一个处理器并行地计算,编写这种形式的程序就称为并行程序设计。 基本思路是:n台计算机应能提供n倍的单机速度,这样求解问题将在1/n时间完成。 1.2 提高计算速度的潜力 约定:进程数或处理器数用P来表示,    多处理机表示有多于一个处理器的并行计算机系统。 1.进程:将计算分成能并行执行的多个任务      或进程。 2.粒度(granularity):进程的大小可用粒度来描述。 粗粒度、细粒度、中粒度。 3.粒度与处理器数有关:数据块大小固定,粒度增大,处理器数减少 1.2.1 加速系数(speedup factor) 衡量一个并行系统和一个单机系统相对性能的标准是加速系数S(p),定义为: S(p)=ts/tp 理论分析可以使用计算步。 当s(p)=p时,称为线性加速比;或计算可分成相等持续时间的进程; 当s(p)p时,可能使用了一个次优化的顺序算法。称为超线性加速比。 效率 用来判定处理器用于有用的计算的时间比例。 1.2.2.什么是最大的加速比 几种因素并行的开销,限制加速比: 1)并非所有处理器都能完成有用的工作;有闲置状态 2)在并行程序中需要顺序计算中出现额外计算; 3)发送消息所需通信时间 .最大加速比(阿姆得尔定律Amdahl) S(n)=ts/(fts+(1-f) ts/p)=p/(1+(p-1)f) 说明:即使有无限多个处理器,最大加速比仍被限制在1/f,应用问题串行部分的瓶颈无法用增加处理器个数来解决,该定律假设了问题规模是固定的,也称为固定规模问题的加速比定律。 .算法的可扩展性 硬件可扩展性和算法可扩展性。 一个并行算法能容纳更多数据而只增加少量有限的计算步。 8.Gustafson定律 按照Amahdl定律,即使只有10%的串行操作,用1000个处理器的最大加速比也不会超过10。但Gustafson 等三人在1988年2月在含有1024个处理机的并行系统上进行曲面波模拟等应用问题实验中,实际加速比分别达到了1016、1020、1021!因此, Amdahl定律蕴含着问题规模是固定的假设,即算法中的可并行成分不随处理机个数变化的假设是不符合实际的,通过适当增加问题的规模可以达到线性加速比。 Gustafson定律的约束条件是:假设并行执行时间是固定。当增加问题规模时,代码中串行部分并不会随问题规模的增大而增加。 定律推导:fts是串行部分所需时间,(1-f)ts为在单处理机上执行计算的并行部分所需的时间。则单处理机总的执行时间为fts+(1-f)ts,并行时间为fts+(1-f)ts/p=1,由Amdahl定律推出:s(p)=p+(1-p)fts 结论:要获得较高的加速比,应随处理机数目的增加而增加问题的规模,而不是固定问题的规模。 区别:Amdahl与Gustafson从不同角度看待并行处理,前者强调通过并行处理来缩短求解问题的时间,后者强调在同样的时间里,通过并行处理能运行较大的运算量。 1.2.3 消息传递计算 消息的传递占很大的开销,则并行时间包括: 通信时间和计算时间两部分。 计算/通信比,比越大,说明计算的时间多,通信时间少,程序的效率高。反之,计算时间少,效率低。 1.4 用连网计算机作为多计算机平台 1.集群或工作站网(Cluster) 优点:1)成本低;2)可扩展性大;3)可用现有的软件; 使用的编程软件工具有:PVM或MPI 1.5提高计算速度的潜力 1.进程:将计算分成能并行执行的多个任务或进程。 2.粒度(granularity):进程的大小可用粒度来描述。 粗粒度、细粒度、中粒度。 3. 计算/通信比=计算机时间/通信时间,用来衡量粒度的指标 4.粒度与处理器数有关:数据块大小固定,粒度增大,处理器数减少 2.加速系数 衡量一个并行系统和一个单机系统相对性能的标准是加速系数S(n),定义为: S(n)=ts/tp 理论分析可以使用计算步。 当s(n)=n时,称为线性加速比;或计算可分成相等持续时间的进程; 当s(n)n时,可能使用了一个次优化的顺序算法。 3.开销 几种因素限制加速比,1)并非所有处理器都能完成有用的工作;2)在顺序计算中出现额外计算;3)发送消息所需通信时间 4.最大加速比(阿姆得尔定律Amdahl) S(n)=ts/(fts+(1-f) ts/n)=n/(1+(n-1)f) 说明:即使有无限多个处理器,最大加速比仍被限制在1/f,应用问题串行部分的瓶颈无法用增加处理器个数来解决,该定律假设了问题规模是固定的,也称为固定规模问题的加速比定律。 5.效率 用来判

文档评论(0)

xx88606 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档