- 16
- 0
- 约 10页
- 2017-08-31 发布于河南
- 举报
主成分分析
类型:一种处理高维数据的方法。
降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。
一、总体主成分
1.1 定义
设 X1,X2,…,Xp 为某实际问题所涉及的 p 个随机变量。记
X=(X1,X2,…,Xp)T,其协方差矩阵为
它是一个 p 阶非负定矩阵。设
(1)
则有
(2)
第 i 个主成分:
一般地,在约束条件
及
下,求 li 使 Var(Yi)达到最大,由此 li 所确定的
称为 X1,X2,…,Xp 的第 i 个主成分。
1.2 总体主成分的计算
设 是的协方差矩阵,的特征值及相应的正交单位化特征向量分别为
及
则 X 的第 i 个主成分为
(3)
此时
1.3 总体主成分的性质
1.3.1 主成分的协方差矩阵及总方差
记 为主成分向量,则 Y=PTX,其中,且
由此得主成分的总方差为
即主成分分析是把 p 个原
原创力文档

文档评论(0)