对称矩阵三对角化的混合并行算法设计研究.pdfVIP

  • 10
  • 0
  • 约1.72万字
  • 约 6页
  • 2018-01-14 发布于广东
  • 举报

对称矩阵三对角化的混合并行算法设计研究.pdf

并行计算 97 对称矩阵三对角化的混合并行算法设计 z 赵永华L 迟学斌, (1.中国科学院计算机网络信息中心超级计算中心,北京100080) (2.德州学院计算机科学计算系,253001) 内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpemMP共享内存并行采用 了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明, MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。 关键词:对称矩阵,并行块算法,三对角矩阵,加速比,MPI+OpenMP abstract:BasedonHouseholder of adense transformation,MPI+OpenMPparallelalgorithm hybrid reducing matrixto formis focusesonword overheadand symmetric tridiagonalpresented.Thispaper load,communication evaluationonclusterofSMP’Senvironments.Acoarse istakeninParallelof performance grainOpenMPapproach shared overcomestheimbalanceworkload thecommunicationoverload.An OpenMPmemory,this problem,reduces the onthe shows hasthebetter experimentalanalysis hybrid algorithm Deepcomp6800 MPI+OpenMP performance and than MPI. scalabilitypure matrix,Parallel Keywords:Symmetricalgorithm,Tridiagonalmatrix,speedup,MPI+OpenMP 1引言 享内存并行、节点间通过消息传递的混合编程( 矩阵特征值问题作为数值计算的重要问题 更有效地利用SMP集群的特性。 存在于许多科学领域中,并在结构力学、工程设 结合消息传递和共享并行的混合模型( 计、计算物理和量子力学中具有重要作用。因为 具有重要意义和广泛的应用,矩阵特征值问题是 用中。其范围包括coastalwave分析、大气研 当前国内外高性能计算机的主要计算任务之一。 究、分子动态分析等。而如何在SMP集群系统上 基于分布存储并行机,人们对对称特征值问题的 设计有效的数值计算并行算法,以及利用混合编 并行算法进行了深入的研究,并形成了现有的以 程模型进行高性能数值软件包的开发仍未得到很 低层 (10w—level)消息传递库和串行BLAS库为求 好的研究。 解构件的几个并行软件包:ScaLAPCAK[2】、基于SMP集群系统,我们在深腾680

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档