- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
巧用 Matlab 实现主成分分析
概述
Matlab 语言是当今国际上科学界 (尤其是自动控制领域 ) 最具影响力、也是 最有活力的软件。它起源于矩阵运算, 并已经发展成一种高度集成的计算机语言。 它提供了强大的科学运算、 灵活的程序设计流程、 高质量的图形可视化与界面设 计、与其他程序和语言的便捷接口的功能。 Matlab 语言在各国高校与研究单位 起着重大的作用。主成分分析是把原来多个变量划为少数几个综合指标的一种统 计分析方法,从数学角度来看,这是一种降维处理技术。
1.1 主成分分析计算
步骤
PCA
① 计算相关系数矩阵
r11
r12
r1p
R
r21
r22
r2p
rp1
rp2
rpp (1 )
在( 3.5.3)式中, rij
(i, j=1 ,2,
…,p)为原变量的xi与xj之间的相关
系数,其计算公式为
rij(Xki X
rij
(Xki Xi)(Xkj Xj)
k 1
n
X)2 (Xkj Xj)2
k 1
(2)
因为R是实对称矩阵(即rj=rji),所以只需计算上三角元素或下三角元素即可。
计算特征值与特征向量
首先解特征方程I R 0 ,通常用雅可比法(Jacobi )求出特征值 i(i 1,2, ,P),并使其按大小顺序排列,即 1 2 , p 0 ;然后分别求
P
出对应于特征值i的特征向量e(i 1,2, , p)。这里要求e =1,即 ej 1,
j 1
其中eij表示向量e的第j个分量。
计算主成分贡献率及累计贡献率
主成分乙的贡献率为
(i 1,2, , p)
累计贡献率为
(i1,2, , p)
(i
1,2, , p)
般取累计贡献率达85 — 95%
般取累计贡献率达
85 — 95%的特征值
m所对应的第一、第
…,第m (m p)个主成分
计算主成分载荷
其计算公式为
lj P(Z,xJ /?ej(i,j 1,2, ,p) (3)
得到各主成分的载荷以后,还可以按照(3.5.2 )式进一步计算,得到各主
成分的得分
z11
Z12
Z1 m
Z
Z21
Z22
z2m
Zn1
Zn2
Znm
程序结构及函数作用
在软件Matlab中实现主成分分析可以采取两种方式实现: 一是通过编程来 实现;二是直接调用 Matlab种自带程序实现。下面主要主要介绍利用 Matlab 的矩阵计算功能编程实现主成分分析。
2.1程序结构
主函数Cwpri nt.m
主函数
子函数
Cwstd.mCwfac.mCwscore.m
Cwstd.m
Cwfac.m
Cwscore.m
2.2函数作用
Cwstd.m ――用总和标准化法标准化矩阵
Cwfac.m 计算相关系数矩阵;计算特征值和特征向量;对主成分进行
排序;计算各特征值贡献率;挑选主成分(累计贡献率大于 85%),输出主成分 个数;计算主成分载荷
Cwscore.m 计算各主成分得分、综合得分并排序
Cwpri nt.m 读入数据文件;调用以上三个函数并输出结果
读者注意,在做主成分分析时一定要看清原理,两个重点,一个是选取 85%,
一个是matalab严格区分大小写。这是编者读完网上代码后改写的正确代码。
源程序
cwstd.m
%cwstd.m, 用总和标准化法标准化矩阵
function std=cwstd(vector)
cwsum=sum(vector,1); % 对列求和
[a,b]=size(vector); % 矩阵大小 ,a 为行数 ,b 为列数 for i=1:a
for j=1:b
std(i,j)= vector(i,j)/cwsum(j);
end
end
cwfac.m
%cwfac.m
function result=cwfac(vector);
fprintf( 相关系数矩阵 :\n)
std= corrcoef (vector) % 计算相关系数矩阵 //
fprintf( 特征向量 (vec) 及特征值 (val) : \n)
[vec,val]=eig(std) % 求特征值 (val) 及特征向量 (vec) newval=diag(val) ;
[y,i]=sort(newval) ;% 对特征根进行排序, y 为排序结果, i
[y,i]=sort(newval) ;
fprintf( 特征根排序: \n)
for z=1:length(y)
newy(z)=y(length(y)+1-z);
end
fprintf(%g\n,newy)
rate=y/sum(y);
fprintf(\n 贡献率: \n)
newrate=newy/sum(newy)
sumrate=0;
newi=[];
for k=length(y):-1:1
sumrate=sumrate+rate(k)
原创力文档


文档评论(0)