- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 非对称特征值问题的计算方法
这一章我们来介绍矩阵特征值和特征向量的计算方法。大家知道,求一个矩阵的特征值问题实质上是求一个多项式的根的问题。而数学上已经证明:5阶以上的多项式的根一般不能用有限次运算求得。因此,矩阵特征值的计算方法本质上都是迭代的。目前,已有不少非常成熟的数值方法用于计算矩阵的全部或部分特征值和特征向量。而全面系统地介绍所有这些重要的数值方法,会远远超出我们这门课程的范围,因而这里我们仅介绍几类最常用的基本方法。
6·1 基本概念和性质
设,一个复数称作是的一个特征值是指存在非零向量使得.复向量称作是关于特征值的特征向量.
复数是A的一个特征值的充分必要条件是,因而称多项式
为A的特征多项式.显然阶矩阵的特征多项式是一个首项系数为1的次多项式,而且有个特征值.记A的特征值的全体为,通常称之为A的谱集.
假定有如下分解
其中,,则称为的代数重数(简称重数);而称数
为的几何重数。易知如果,则称是A的一个单特征值;否则,称是A的一个重特征值。对于一个特征值,如果,则称其是A的一个半单特征值。显然,单特征值必是半单特征值。如果A的所有特征值都是半单的,则称A是非亏损的。容易证明,A是非亏损的充分必要条件是A有个线性无关的特征向量(即A是可对角化矩阵)。
设.若存在非奇异阵使得
则称A与B是相似的,而上述变换称作是相似变换.若A与B相似,则A和B有相同的特征值,而且是A的一特征向量的充分必要条件是是B的一个特征向量.这样,如果我们能够找到一个适当的变换矩阵,使B的特征值和特征向量易于求得,则我们就可立即得到A的特征值和相应的特征向量.很多计算矩阵特征值和特征向量的方法正是基于这一基本思想而得到的.从理论上讲,利用相似变换可以将一个矩阵约化成的最简单形式是Jordan标准型,即有
定理6·1·1(Jordan分解定理)设有个互不相同的特征值,其重数分别为,则必存在一个非奇异矩阵使得
其中
并且除了的排列次序可以改变外是唯一确定的。
上述定理中的矩阵称作A的Jordan标准型,其中每个子矩阵称作Jordan块。
如果限定变换阵为酉矩阵,则有如下著名的Schur分解定理。
定理6·1·2(Schur分解定理) 设,则存在酉矩阵使得
其中是上三解矩阵;而且适当选取,可使得的对角元素按任意指定的顺序排列。
这一定理无论在理论上还是在实际应用上都是非常重要的,著名的QR方法就是基于这一定理而设计的。
下述定理对于估计某些特征值的界限是十分方便而有用的。
定理6·1·3(Gerschgorin圆盘定理)设,令
则有
从数值计算的角度来看,首先应弄清楚的问题是要计算的特征值和特征向量是否是病态的,也就是说矩阵的元素有微小的变化,是否会引起所关心的特征值和特征向量的巨大变化。对于一般的方阵来说,这一问题是非常复杂的,即于篇幅,这里我们只介绍一个简单而又非常重要的结果。
假定是的一个单特征值,是属于它的单位特征向量(即)。令是酉矩阵(),即的列向量构成的一组标准正交基,则有
其中阶方阵。由是的一个单特征值的假定,知且
于是我们可定义
此外,由于,故必存在非零向量使。通常称为这属于的左特征值。是单特征值的条件蕴含着.故可选取使.若给矩阵以微小的扰动使其变为,记,则存在的一个特征值和对应的特征向量,使得
这表明和的敏感性分别与和的大小有关.因此,我们分别称和为特征值和特征向量的条件数,记作
.
有关特征值和特征向量的敏感性问题的较详细讨论参见[18].
6·2 幂法
幂法是计算一个矩阵的模最大特征值和对应的特征向量的一种迭代方法.为了说明幂法的基本思想,我们先假定是可对角化的,即A有如下分解
?????????????????????????????????? (6.2.1)
其中非奇异,再假定
?????????????????????????????????? (6.2.2)
现任取一向量由于的列向量构成的一组基,故可表示为
?????????????????????????? (6.2.3)
这里.这样,我们有
???????????????????? (6.2.4)
由此即知
这表明,当而且充分大时,向量
?????????????????????????????????? (6.2.5)
就是的一个很好的近似特征向量.
这样,我们自然想到用(6.2.5)来求的近似特征向量.然而,实际计算时,这是行不通的.其原因有二:一是我们事先并不知道的特征值;二是对充分大的计算的工作量太大,有可能造成溢出.
仔细观察(6.2.5),不难发现(6.2.5)中的仅改变向量的长度,并不影响它的方向.而我们所感兴趣的只是的方向,并非它的长度.因此,我们不必非用来约化的长度,而可用其他方便的常
文档评论(0)