- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
带状对称正定矩阵的并行Cholesky+分解及其实现.pdf
带状对称正定矩阵的并行 Cholesky 分解及其实现
张健飞 姜弘道
(河海大学土木工程学院,南京,210098)
zhjf77@163.com
摘 要 带状对称正定矩阵的 Cholesky 分解在实际工程计算中占有重要的地位,其串行算法已经成
熟,但其并行算法由于对计算机体系结构的高度依赖性,仍受到广泛关注。对于稠密矩阵的并行分
解和向量机上的带状对称矩阵的并行分解,前人已经做了不少工作。本文基于网络机群这一新的并
行计算环境和消息传递界面 MPI 给出了一种等带宽存储格式下的的并行 Cholesky 分解算法,算法采
用行卷帘存储方案和提前发送策略,从而减少了负载的平衡和通信时间,增加了计算通信的重叠。
数值试验表明,算法具有较高的并行加速比和效率。
关键字 带状对称正定矩阵;等带宽;并行计算;Cholesky 分解;网络机群
引言
并行计算是近几十年来随着并行计算机发展而发展起来的一门新兴学科,并且随着待求问题规
模的日益增大,越来越受到人们的重视,可以说并行计算是未来科学与工程计算的发展方向。目前
比较流行的并行计算机主要是分布式存储的多指令流多数据流(MIMD )并行计算机,由于它是由
多台相互独立的处理机以一定的方式联结起来的新型计算机系统,因此无论是在运算速度方面还是
在存储空间方面,比起普通串行计算机都有了很大提高,从而极大地提高了解题能力。网络机群 (PC
Cluster )是近几年兴起的一种具有良好的性能价格比的并行环境,通常也可归为分布式存储的 MIMD
并行环境。
在实际工程计算领域中,系数矩阵为带状对称正定矩阵的线性系统的求解是很常见的问题,例
如应用有限元求解结构力学问题时,如果节点编号按照一定的规则,则最后所归结出的线性方程组,
其系数矩阵大多具有对称正定和带状的性质。同时因为求解一个线性系统,其主要工作是计算系数
矩阵的分解。因此研究此类矩阵的并行分解算法有着重要的意义。
对于带状对称正定矩阵(Symmetric Positive Definition Matrix),由于其自身的特点,采用稠密矩
阵的 Cholesky 分解方法显然是不经济的。因此需研究经济的存储方法和相应算法。对于这类矩阵通
常采用等带宽和变带宽两种存储方法。基于这两种存储方法的串行 Cholesky 分解已经有了很好的算
法,而其并行算法仍受到人们关注,这是因为并行算法对计算机体系结构的依赖程度远高于串行算
法。文[1]研究了向量机上基于等带宽存储的此类矩阵的 Cholesky 分解,文[2]讨论了 MIMD 型并行
机上的此类矩阵在完全存储情况下的算法,文[3][4]给出了分布式存储的 MIMD 型机器上的稠密矩阵
的并行分解算法。本文基于 MPI 和网络机群环境研究了带状对称正定矩阵在等带宽存储方式下的并
行 Cholesky 分解算法,并采用提前发送(Send Ahead )的策略减少了通信时间。数值试验表明所得
的算法具有较高的加速比和效率。
1 稠密矩阵的并行 Cholesky 分解算法
T
定理 假设 A 是 n 阶对称正定矩阵,则存在唯一的单位上三角矩阵 L,对角矩阵 D,使得 A=L DL,
并且 D 的对角元素全为正。
推论 T
假设 A 是 n 阶对称正定矩阵,则存在唯一的对角元素全为正的上三角矩阵 L,使得 A=L L。
1
对于稠密矩阵适合在分布式存储的并行环境下运行的并行 Cholesky 分解算法,文[3][4]给出了
一部分算法,本文所给出方案的是在 Cholesky 分解的行格式算法上得出的。假设对称正定矩阵 A,
只需其上三角部分。为减少负载不平衡,采用行卷帘分布存储。为节省内存,在下列算法中,上三
角矩阵 L 存放在 A 的相应位置。处理机联结拓扑结构为环形,如图 1 所
文档评论(0)