PCA(协方差矩阵和奇异值分解两种方法求特征值特征向量).docxVIP

PCA(协方差矩阵和奇异值分解两种方法求特征值特征向量).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PCA(协方差矩阵和奇异值分解两种方法求特征值特征向量)

PCA(协方差矩阵和奇异值分解两种方法求特征值特征向量)2015-12-30 10:43?1157人阅读?评论(0)?收藏?举报?分类:模式识别(1)?1.问题描述??在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来不便。如果分别对每个指标进行分析,分析往往是孤立的,而不是综合的。盲目减少指标会损失很多信息,容易产生错误的结论。?2.过程主成分分析法是一种数据转换的技术,当我们对一个物体进行衡量时,我们将其特征用向量(a1,a2,a3,...an)进行表示,每一维都有其对应的variance(表示在其均值附近离散的程度);其所有维的variance之和,我们叫做总的variance;我们对物体进行衡量时,往往其特征值之间是correlated的,比如我们测量飞行员时,有两个指标一个是飞行技术(x1),另一个是对飞行的喜好程度(x2),这两者之间是有关联的,即correlated的。我们进行PCA(主成分分析时),我们并没有改变维数,但是我们却做了如下变换,设新的特征为(x1,x2,x3...,xn);其中1)x1的variance占总的variance比重最大;2)除去x1,x2的variance占剩下的variance比重最大;....依次类推;最后,我们转换之后得到的(x1,x2,...xn)之间都是incorrelated,我们做PCA时,仅取(x1,x2,....xk),来表示我们测量的物体,其中,k要小于n。主成分的贡献率就是某主成分的方差在全部方差中的比值。这个值越大,表明该主成分综合X1,X2,…,XP信息的能力越强。如果前k个主成分的贡献率达到85%,表明取前k个主成分基本包含了全部测量指标所具有的信息,这样既减少了变量的个数又方便于对实际问题的分析和研究。 注意,当(a1,a2,a3,...an)之间都是incorrelated时,我们就没有做PCA的必要了?数据点在上图所示的方向上进行投影后,数据仍然有着很大的variance,但在下图所示的方向上,投影后的数据的variance就很小。我们所需要做的就是找到这一系列的向量,使得数据在其上的投影有着较大的variance。?3.数学描述 为了能够找到这一系列的向量,我们对数据进行预处理 注意svd函数只适合行数大于列数的矩阵,如果行数小于列数,可对其转置矩阵做SVD分解? A?=?U*S*V;而?(A*A)*V? =?(U*S*V)?*?(U*S*V)?*?V =?V*S*U?*?(U*S*V)*V =?V*S*(U*U)*S*?(V*V) =?V*(S*S)*E*E?(E是单位矩阵) =?(S的平方)*V?(S在对角线上才有值,其余全为0)....(2) 对照(1)(2)式我们可以看到, A的SVD分解出来的V就是(A*A)这个矩阵的特征向量! 所以PCA算法中我们不需要计算扩散矩阵(A*A),对A进行SVD分解, 得到V,取V的前k个columns即可。1) Alcohol?2) Malic acid?3) Ash?4) Alcalinity of ash?5) Magnesium?6) Total phenols?7) Flavanoids?8) Nonflavanoid phenols?9) Proanthocyanins?10)Color intensity?11)Hue?12)OD280/OD315 of diluted wines?13)Proline样本数为130,在matlab下按照以上步骤,进行PCA,得到的特征值如下:选取前k个特征值使得前k个主成分的贡献率达到85%,计算得到的结果为k=1,其对应的特征向量为u=令X=X*u即可得到新的X,其中X原来维数为130×13,进行PCA后的维数为130×1。

文档评论(0)

didala + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档