巧用matlab进行主成分降维.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
巧用 Matlab 实现主成分分析 概述 Matlab 语言是当今国际上科学界 (尤其是自动控制领域 ) 最具影响力、也是 最有活力的软件。它起源于矩阵运算, 并已经发展成一种高度集成的计算机语言。 它提供了强大的科学运算、 灵活的程序设计流程、 高质量的图形可视化与界面设 计、与其他程序和语言的便捷接口的功能。 Matlab 语言在各国高校与研究单位 起着重大的作用。主成分分析是把原来多个变量划为少数几个综合指标的一种统 计分析方法,从数学角度来看,这是一种降维处理技术。 1.1 主成分分析计算 步骤 PCA ① 计算相关系数矩阵 r11 r12 r1p R r21 r22 r2p rp1 rp2 rpp (1 ) 在( 3.5.3)式中, rij (i, j=1 ,2, …,p)为原变量的xi与xj之间的相关 系数,其计算公式为 rij(Xki X rij (Xki Xi)(Xkj Xj) k 1 n X)2 (Xkj Xj)2 k 1 (2) 因为R是实对称矩阵(即rj=rji),所以只需计算上三角元素或下三角元素即可。 计算特征值与特征向量 首先解特征方程I R 0 ,通常用雅可比法(Jacobi )求出特征值 i(i 1,2, ,P),并使其按大小顺序排列,即 1 2 , p 0 ;然后分别求 P 出对应于特征值i的特征向量e(i 1,2, , p)。这里要求e =1,即 ej 1, j 1 其中eij表示向量e的第j个分量。 计算主成分贡献率及累计贡献率 主成分乙的贡献率为 (i 1,2, , p) 累计贡献率为 (i1,2, , p) (i 1,2, , p) 般取累计贡献率达85 — 95% 般取累计贡献率达 85 — 95%的特征值 m所对应的第一、第 …,第m (m p)个主成分 计算主成分载荷 其计算公式为 lj P(Z,xJ /?ej(i,j 1,2, ,p) (3) 得到各主成分的载荷以后,还可以按照(3.5.2 )式进一步计算,得到各主 成分的得分 z11 Z12 Z1 m Z Z21 Z22 z2m Zn1 Zn2 Znm 程序结构及函数作用 在软件Matlab中实现主成分分析可以采取两种方式实现: 一是通过编程来 实现;二是直接调用 Matlab种自带程序实现。下面主要主要介绍利用 Matlab 的矩阵计算功能编程实现主成分分析。 2.1程序结构 主函数Cwpri nt.m 主函数 子函数 Cwstd.mCwfac.mCwscore.m Cwstd.m Cwfac.m Cwscore.m 2.2函数作用 Cwstd.m ――用总和标准化法标准化矩阵 Cwfac.m 计算相关系数矩阵;计算特征值和特征向量;对主成分进行 排序;计算各特征值贡献率;挑选主成分(累计贡献率大于 85%),输出主成分 个数;计算主成分载荷 Cwscore.m 计算各主成分得分、综合得分并排序 Cwpri nt.m 读入数据文件;调用以上三个函数并输出结果 读者注意,在做主成分分析时一定要看清原理,两个重点,一个是选取 85%, 一个是matalab严格区分大小写。这是编者读完网上代码后改写的正确代码。 源程序 cwstd.m %cwstd.m, 用总和标准化法标准化矩阵 function std=cwstd(vector) cwsum=sum(vector,1); % 对列求和 [a,b]=size(vector); % 矩阵大小 ,a 为行数 ,b 为列数 for i=1:a for j=1:b std(i,j)= vector(i,j)/cwsum(j); end end cwfac.m %cwfac.m function result=cwfac(vector); fprintf( 相关系数矩阵 :\n) std= corrcoef (vector) % 计算相关系数矩阵 // fprintf( 特征向量 (vec) 及特征值 (val) : \n) [vec,val]=eig(std) % 求特征值 (val) 及特征向量 (vec) newval=diag(val) ; [y,i]=sort(newval) ;% 对特征根进行排序, y 为排序结果, i [y,i]=sort(newval) ; fprintf( 特征根排序: \n) for z=1:length(y) newy(z)=y(length(y)+1-z); end fprintf(%g\n,newy) rate=y/sum(y); fprintf(\n 贡献率: \n) newrate=newy/sum(newy) sumrate=0; newi=[]; for k=length(y):-1:1 sumrate=sumrate+rate(k)

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档