- 6
- 0
- 约2.53万字
- 约 11页
- 2017-02-09 发布于河南
- 举报
主成分分析及MATLAB应用
主成分分析
类型:一种处理高维数据的方法。
降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。
一、总体主成分
1.1 定义
设 X1,X2,…,Xp 为某实际问题所涉及的 p 个随机变量。记
X=(X1,X2,…,Xp)T,其协方差矩阵为
它是一个 p 阶非负定矩阵。设
(1)
则有
(2)
第 i 个主成分:
一般地,在约束条件
及
下,求 li 使 Var(Yi)达到最大,由此 li 所确定的
称为 X1,X2,…,Xp 的第 i 个主成分。
1.2 总体主成分的计算
设 是的协方差矩阵,的特征值及相应的正交单位化特征向量分别为
及
则 X 的第 i 个主成分为
(3)
此时
1.3 总体主成分的性质
1.3.1 主成分的协方差矩阵及总方差
记 为主成分向量,则 Y=PTX,其中,且
由此得主成分的总方差为
即主成分分析是把 p 个原始变量 X1,X2,…,Xp 的总方差
分解成 p 个互不相关变量 Y1,Y2,…,Yp的方差之和,即
而 。
第 k 个主成分的贡献率:;
前m个主成分累计贡献率:,它表明前 m 个主成分Y1,Y2,…,Ym综合提供 X1,X2,…,Xp中信息的能力。
1.3.2 主成分 Yi 与变量 Xj 的相关系数
由于 Y=PTX,故 X=PY,从而
由此可得 Yi 与 Xj 的相关系数为
(4)
1.4 标准化变量的主成分
在实际问题中,不同的变量往往有不同的量纲,由于不同的量纲会引起各变量取值的分散程度差异较大,这时总体方差则主要受方差较大的变量的控制。为了消除由于量纲的不同可能带来的影响,常采用变量标准化的方法,即令
(5)
其中 这时
的协方差矩阵便是
的相关矩阵 ,其中
(6)
利用 X 的相关矩阵 作主成分分析,有如下结论:
设 为标准化的随机向量,其协方差矩阵(即 X 的相关矩阵)为 ,则 的第 i 个主成分为
(7)
并且
(8)
其中 为 的特征值,为相应于特征值 的正交单位特征向量。
第 i 个主成分的贡献率:;
前 m 个主成分的累计贡献率:;
与的相关系数为 。
二、样本主成分
前面讨论的是总体主成分,但在实际问题中,一般 (或)是未知的,需要通过样本来估计。设
为取自
的一个容量为n的简单随机样本,则样本协方差矩阵及样本相关矩阵分别为
(9)
其中
分别以 S 和 R 作为 和的估计,然后按总体主成分分析的方法作样本主成分分析。
三、 例 题
某市为了全面分析机械类个企业的经济效益,选择了8个不同的利润指标,14企业关于这8个指标的统计数据如下表所示,试进行主成分分析。
表1 14家企业的利润指标的统计数据
变量
企业序号
净产值利润率(%)
xi1
固定资产利润率(%)
xi2
总产值利润率(%)
xi2
销售收入利润率(%)
xi3
产品成本利润率(%)
xi5
物耗利润率(%)
xi6
人均利润率
xi7(千元/人)
流动资金利润率(%)
xi8
1
40.4
24.7
7.2
6.1
8.3
8.7
2.442
20.0
2
25.0
12.7
11.2
11.0
12.9
20.2
3.542
9.1
3
13.2
3.3
3.9
4.3
4.4
5.5
0.578
3.6
4
22.3
6.7
5.6
3.7
6.0
7.4
0.176
7.3
5
34.3
11.8
7.1
7.1
8.0
8.9
1.726
27.5
6
35.6
12.5
16.4
16.7
22.8
29.3
3.017
26.6
7
22.0
7.8
9.9
10.2
12.6
17.6
0.847
10.6
8
48.4
13.4
10.9
9.9
10.9
13.9
1.772
17.8
9
40.6
19.1
19.8
19.0
29.7
39.6
2.449
35.8
10
24.8
8.0
9.8
8.9
11.9
16.2
0.789
13.7
11
12.5
9.7
4.2
4.2
4.6
6.5
0.874
3.9
12
1.8
0.6
0.7
0.7
0.8
1.1
0.056
1.0
13
32.3
1
您可能关注的文档
- 河南专升本管理学试题及答案2009年.doc
- 第三方存管等培训.ppt
- 现代企业管理第一、二章习题.doc
- 第十二章 企业价值评估与管理.ppt
- 11章 资产评估.ppt
- 资产评估试题.doc
- 如何培养员工的中忠程.doc
- 工程建设项目前期准备工作.ppt
- 市场的开发与管理.ppt
- 中学美术教材教法.doc
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 贫困户专项贷款业务申请表.docx VIP
- 2025年AWS认证AWSDataSync与SnowballEdge结合的大规模数据迁移方案专题试卷及解析.pdf VIP
- 2025年演出经纪人通过组织小型沙龙、读剧会等人脉活动主动建圈专题试卷及解析.pdf VIP
- 2025年演出经纪人演出市场主体准入中的专业人员配备要求专题试卷及解析.pdf VIP
- 2025年金融风险管理师外汇储备管理与币种结构决策专题试卷及解析.pdf VIP
- 2025电信转正考试参考题库(含答案解析).docx VIP
- 《低空无人驾驶航空器起降场地安全通用要求》.pdf VIP
- 基于代谢组学的肥胖症个性化干预数字方案.pdf VIP
- 低空飞行气象安全通用要求.docx VIP
- 内镜中心应急预案.pdf VIP
原创力文档

文档评论(0)