PCA降维(MATLAB实践)完整版.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PCA降维(MATLAB实践) PCA原理 PCA的原理就是将原来的样本数据投影到⼀个新的空间中,相当于我们在矩阵分析⾥⾯学习的将⼀组矩阵映射到另外的坐标系下。通过⼀个 转换坐标,也可以理解成把⼀组坐标转换到另外⼀组坐标系下,但是在新的坐标系下,表⽰原来的原本不需要那么多的变量,只需要原来样 本的最⼤的⼀个线性⽆关组的特征值对应的空间的坐标即可。 ⽐如,原来的样本是30*1000000的维数,就是说我们有30个样本,每个样本有1000000个特征点,这个特征点太多了,我们需要对这 些样本的特征点进⾏降维。那么在降维的时候会计算⼀个原来样本矩阵的协⽅差矩阵,这⾥就是1000000*1000000,当然,这个矩阵太 ⼤了,计算的时候有其他的⽅式进⾏处理,这⾥只是讲解基本的原理,然后通过这个1000000*1000000的协⽅差矩阵计算它的特征值和 特征向量,最后获得具有最⼤特征值的特征向量构成转换矩阵。⽐如我们的前29个特征值已经能够占到所有特征值的99%以上,那么我们 只需要提取前29个特征值对应的特征向量即可。这样就构成了⼀个1000000*29的转换矩阵,然后⽤原来的样本乘以这个转换矩阵,就可 以得到原来的样本数据在新的特征空间的对应的坐标。30*1000000 * 1000000*29 = 30 *29, 这样原来的训练样本每个样本的特征值 的个数就降到了29个。 ⼀般来说,PCA降维后的每个样本的特征的维数,不会超过训练样本的个数,因为超出的特征是没有意义的。 特征向量和特征值 特征向量是⼀个向量,当在它上⾯应⽤线性变换时其⽅向保持不变。考虑下⾯的图像,其中三个向量都被展⽰出来。绿⾊正⽅形仅说明施加 到这三个向量上的线性变换。 矩阵乘法对应了⼀个变换,是把任意⼀个向量变成另⼀个⽅向或长度都⼤多不同的新向量。在这个变换的过程中,原向量主要发⽣旋转、伸 缩的变化。如果矩阵对某⼀个向量或某些向量只发⽣伸缩变换,不对这些向量产⽣旋转的效果,那么这些向量就称为这个矩阵的特征向量, 伸缩的⽐例就是特征值。 代码 load hald [pc,score,latent,tsquare]=princomp(ingredients);%调⽤pca分析函数 %下⾯为计算ingredients协⽅差矩阵 cov_ingredients=cov(ingredients); %接下来计算该协⽅差矩阵的特征值和特征向量 [V,D]=eig(cov_ingredients); %计算降维后的空间所能表⽰原空间的程度 cumsum(latent)./sum(latent) ans = 0.8660 0.9789 0.9996 1.0000 %由以上ans值可以看出前两个主成分就能表⽰原空间的97.886% biplot(pc(:,1:2),Scores,score(:,1:2),VarLabels,{X1,X2,X3,X4})

文档评论(0)

Rocky006 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档