网站大量收购独家精品文档,联系QQ:2885784924

对称矩阵三对角化的混合并行算法设计.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对称矩阵三对角化的混合并行算法设计.pdf

并行计算 97 对称矩阵三对角化的混合并行算法设计 z 赵永华L 迟学斌, (1.中国科学院计算机网络信息中心超级计算中心,北京100080) (2.德州学院计算机科学计算系,253001) 内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpemMP共享内存并行采用 了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明, MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。 关键词:对称矩阵,并行块算法,三对角矩阵,加速比,MPI+OpenMP abstract:BasedonHouseholder of adense transformation,MPI+OpenMPparallelalgorithm hybrid reducing matrixto formis focusesonword overheadand symmetric tridiagonalpresented.Thispaper load,communication evaluationonclusterofSMP’Senvironments.Acoarse istakeninParallelof performance grainOpenMPapproach shared overcomestheimbalanceworkload thecommunicationoverload.An OpenMPmemory,this problem,reduces the onthe shows hasthebetter experimentalanalysis hybrid algorithm Deepcomp6800 MPI+OpenMP performance and than MPI. scalabilitypure matrix,Parallel Keywords:Symmetricalgorithm,Tridiagonalmatrix,speedup,MPI+OpenMP 1引言 享内存并行、节点间通过消息传递的混合编程( 矩阵特征值问题作为数值计算的重要问题 更有效地利用SMP集群的特性。 存在于许多科学领域中,并在结构力学、工程设 结合消息传递和共享并行的混合模型( 计、计算物理和量子力学中具有重要作用。因为 具有重要意义和广泛的应用,矩阵特征值问题是 用中。其范围包括coastalwave分析、大气研 当前国内外高性能计算机的主要计算任务之一。 究、分子动态分析等。而如何在SMP集群系统上 基于分布存储并行机,人们对对称特征值问题的 设计有效的数值计算并行算法,以及利用混合编 并行算法进行了深入的研究,并形成了现有的以 程模型进行高性能数值软件包的开发仍未得到很 低层 (10w—level)消息传递库和串行BLAS库为求 好的研究。 解构件的几个并行软件包:ScaLAPCAK[2】、基于SMP集群系统,我们在深腾680

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档