- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三对角系统并行算法的研究概况的论文.doc
三对角系统并行算法的研究概况的论文
【摘 要】在科学和工程计算中,许多问题往往归结为三对角线性方程组的求解,其并行算法的研究具有重要意义。文章全面总结了当前求解三对角线性方程组的两类并行算法:直接解法和迭代解法,并介绍了其特点。
【关键词】三对角线性方程组;分治策略;并行算法;算法可扩展性
一、概述
三对角线性方程组的求解是许多科学和工程计算中最重要也是最基本的问题之一。在核物理、流体力学、油藏工程、石油地震数据处理及数值天气预报等许多领域的大规模科学工程和数值处理中都会遇到三对角系统的求解问题。很多三对角线性方程组的算法可以直接推广到求解块三对角及带状线性方程组。由于在理论和实际应用上的重要性,近20年来三对角方程组的并行算法研究十分活跃。
大规模科学计算需要高性能的并行计算机。随着软硬件技术的发展,高性能的并行计算机日新月异。现今,smp可构成每秒几十亿次运算的系统,pvp和copp和dsm可构成每秒万亿次运算或更高的系统。
高性能并行计算机只是给大型科学计算提供了计算工具。如何发挥并行计算机的潜在性能和对三对角系统进行有效求解,其关键在于抓住并行计算的特点进行并行算法的研究和程序的设计与实现。另外,对处理机个数较多的并行计算系统,在设计并行算法时必须解决算法的可扩展性,并对可扩展性进行研究和分析。.
二、问题的提出
设三对角线性方程组为
ax=y (1)
式中:a∈rn×n非奇异,αij=0, 。x=(x1,x2,…xn)t y=(y1,y2,…yn)t。
此系统在许多算法中被提出,因此研究其高性能并行算法是很有理论和实际意义的。
三、并行求解三对角系统的直接解法
关于三对角线性方程组的直接求解已经有大量并行算法,其中3090vf向量机的特点提出了局部循环约化法;p.amodio针对分布式系统的特点改进了循环约化方法;最近针对此方法又提出对三对角方程组进行更大约化步的交替迭代策略。
(三)基于矩阵乘分解算法
将系数矩阵a分解成a=ft,方程ax=b化为fy=b和tx=y两个方程组的并行求解。这种算法又可以分为两类:
1.重叠分解。如odio在1993年对这类算法进行了很好的总结,用本地lu、本地lud和本地循环约化法求解,并在1995年提出基于矩阵乘分解的并行qr算法。h.michielse和a.van der vorst改变ichielse和a.van der vorst算法中的通信模式从单向串行改为双向并行,提出dpp算法,是目前最好的三对角方程组分布式算法之一。2000年骆志刚等中依据dpp算法,利用计算与通信重叠技术,减少处理机空闲时间取得了更好的并行效果。此类算法要求解p-1阶缩减系统。
2.不重叠分解。例如lap; sameh算法、johsoon算法、baron算法、chaattor在1995年提出的算法都属于这一类。此类算法要求解2p-2阶缩减系统。
(四)基于矩阵和分解算法
将系数矩阵分解成a=ao+△a,这类算法的共同特点是利用sherman morrison公式将和的逆化为子矩阵逆的和。按矩阵分解方法,这种算法又可分为两类:
1.重叠分解。这类算法首先由mehrmann在1990年提出,通过选择好的分解在计算过程中保持原方程组系数矩阵的结构特性,具有好的数值稳定性,需要求解p-1阶缩减系统。
2.不重叠分解。sun等在1992年提出的并行划分lu算法ppt算法和并行对角占优算法pdd算法均属于这一类。需要求解2p-2阶缩减系统。其中pdd算法的通讯时间不随处理机的变化而变化,具有很好的可扩展性。x.h.sun和为维子空间,一般投影方法是从m维仿射子空间x0+km中寻找近似解xm使之满足petrov-galerkin条件
y-axm┻lm
其中lm为另一个维子空间。如果km是krylov子空间,则上述投影方法称为krylov子空间方法。krylov子空间km(a,r0)定义为:
km(a,r0)=span{r0,ar0,a2r0,…,am-1r0}
选取不同的km和lm就得到不同的krylov子空间方法。主要算法包括四类:基于正交投影方法、基于正交化方法、基于双正交化方法、基于正规方程方法。
krylov子空间迭代法的收敛速度依赖于系数矩阵特征值的分布,对于很多问题,直接使用迭代法的收敛速度特别慢,或者根本不收敛。因此使用预条件改变其收敛性,使中断问题可解,并加速收敛速度是需要的。目前人们研究的预条件技术可分为四类:采用基于矩阵分裂的古典迭代法作为预条件子、采用不完全lu分解作预条件子、基于系数矩阵近似逆的预条件子、结合实际问题用多重网格或区域分解作预条件子。对krylov子
文档评论(0)