第6章 并行化程序性能调优.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
采用并行设计 对于语句5,循环体内的四个sum求和,可以并行并列的计算如图: 采用openMP在语句5前面加入pragma omp parallel for语句。如下代码: #pragma omp parallel for for (x = 0; x n; x++) { sumx = sumx + x; sumy = sumy + y[x]; sumx2 = sumx2 + pow(x, 2.0); sumxy = sumxy + (x * y[x]); } 由于sumx,sumy等在循环体内的叠加需要同步,故pragma omp parallel for语句应该改为pragma omp parallel for reduction(+:sumx, sumy, sumx2, sumxy )。代码如下: #pragma omp parallel for reduction(+:sumx, sumy, sumx2, sumxy ) for (x = 0; x n; x++) { sumx = sumx + x; sumy = sumy + y[x]; sumx2 = sumx2 + pow(x, 2.0); sumxy = sumxy + (x * y[x]); } 本章小结 并行化程序性能指标 Intel VTune性能分析器 Intel Thread Checker Intel Thread Profiler * Multi-Core Programming for Windows. 我们可以在业务处理前先同时创建若干个线程,将这若干个线程集合臆想为线程池,当有新的数据要交给线程处理时,主线程就从线程池中找到一个空闲的线程处理这新来的数据,如果线程池中没有找到可用的空闲线程,就新创建一个线程来处理这个数据或等待直到有空闲线程,并在处理完后不销毁它而是把这个线程放到线程池中,以备后用。 采用语句执行的频度和时间复杂度来计算程序性能;是理论值,适合串行程序或简单的并行程序。 通过多次运行的统计规律来测量程序的性能。用于并行多线程程序特别是并发关系组合爆炸,线程间通信复杂的情况下,理论值很难确定的时候。需要有真实的实验分析平台。 * 单线程时间图 * 6.多线程程序开发方法学 多线程程序开发建立在多核处理器和现代操作系统的平台。 本节将讨论采用多线程的软件优化开发的方法。 6.1程序开发及优化周期 分析阶段 线程设计实现阶段 正确性调试阶段 性能测试阶段 * 程序开发优化周期分析阶段 主要分析出待优化程序的程序瓶颈 找到计算强度大的代码区域 分析采用多线程是否可以提高该区域性能 Amdahl定律指出减少串行比例能够提高性能,并且需要衡量减少串行提升的性能应该远多于其伴随系统开销 从负载平衡和粒度的性能指标角度,大块被操作数据且数据间依赖较少的情况,适合多线程优化处理。 6.1程序开发及优化周期 程序开发优化周期线程设计和实现阶段 提供分析阶段提出的问题的线程设计解决方案 第一个过程,分解计算指的是应用功能分解 第二个过程,任务通信量权衡 第三个过程,任务组合 第四个过程,线程映射 6.1 程序开发及优化周期 程序开发优化周期正确性调试阶段 通过调试保证算法的正确,功能上能够完成问题要求 6.1 程序开发及优化周期 程序开发优化周期性能测试阶段 用来检查加速比,粒度等是否满足问题要求 是否还存在热点 是否具有继续提高性能的可能 通过软件工具测试决定是否继续进入下一个迭代周期 6.1程序开发及优化周期 6.2程序开发优化周期软件工具使用 分析阶段是找到待优化程序的突破口。 需要采用性能分析工具 正确性调试阶段用于找到多线程程序中的错误。 6.3案例:二分查找 二分查找又称折半查找,它是一种效率较高的查找方法。二分查找要求:线性表是有序表,即表中结点按关键字有序,并且要用向量作为表的存储结构。不妨设有序表是递增有序的。 基本思想是:设R[low..high]是当前的查找区间,首先确定该区间的中点位置mid=[(low+high)/2];然后将待查的k值与R[mid].keyk,则由表的有序性可知R[mid..n-1].key均大于k,因此若表中存在关键字等于k的记录,则该记录必定是在位置mid左边的子表 * 例如:设算法的输入实例中有序的关键字序列为{1,2,3,4,5,6,7,8,9,12,15,45},在其序列中查找关键字2。 第一步:low指向第一个关键字,high指向最后一个关键字,并计算mid的下标其元素关键字为6。 二分查找第一步 * 第二步:比较R[mid]与被查关键字,62。 二分查找第二步 * 第三步:将high移动到mid的前驱位置。在R[low..mid-1]的位置中查找,并

文档评论(0)

yurixiang1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档