- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对称矩阵三对角化的混合并行算法设计.pdf
并行计算 97
对称矩阵三对角化的混合并行算法设计
z
赵永华L 迟学斌,
(1.中国科学院计算机网络信息中心超级计算中心,北京100080)
(2.德州学院计算机科学计算系,253001)
内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpemMP共享内存并行采用
了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,
MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。
关键词:对称矩阵,并行块算法,三对角矩阵,加速比,MPI+OpenMP
abstract:BasedonHouseholder of adense
transformation,MPI+OpenMPparallelalgorithm
hybrid reducing
matrixto formis focusesonword overheadand
symmetric tridiagonalpresented.Thispaper load,communication
evaluationonclusterofSMP’Senvironments.Acoarse istakeninParallelof
performance grainOpenMPapproach
shared overcomestheimbalanceworkload thecommunicationoverload.An
OpenMPmemory,this problem,reduces
the
onthe shows hasthebetter
experimentalanalysis hybrid algorithm
Deepcomp6800 MPI+OpenMP performance
and than MPI.
scalabilitypure
matrix,Parallel
Keywords:Symmetricalgorithm,Tridiagonalmatrix,speedup,MPI+OpenMP
1引言 享内存并行、节点间通过消息传递的混合编程(
矩阵特征值问题作为数值计算的重要问题 更有效地利用SMP集群的特性。
存在于许多科学领域中,并在结构力学、工程设 结合消息传递和共享并行的混合模型(
计、计算物理和量子力学中具有重要作用。因为
具有重要意义和广泛的应用,矩阵特征值问题是 用中。其范围包括coastalwave分析、大气研
当前国内外高性能计算机的主要计算任务之一。 究、分子动态分析等。而如何在SMP集群系统上
基于分布存储并行机,人们对对称特征值问题的 设计有效的数值计算并行算法,以及利用混合编
并行算法进行了深入的研究,并形成了现有的以 程模型进行高性能数值软件包的开发仍未得到很
低层 (10w—level)消息传递库和串行BLAS库为求
好的研究。
解构件的几个并行软件包:ScaLAPCAK[2】、基于SMP集群系统,我们在深腾680
文档评论(0)