- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析
类型:一种处理高维数据的方法。
降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。
一、总体主成分
1.1 定义
设 X1,X2,…,Xp 为某实际问题所涉及的 p 个随机变量。记
X=(X1,X2,…,Xp)T,其协方差矩阵为
它是一个 p 阶非负定矩阵。设
(1)
则有
(2)
第 i 个主成分:
一般地,在约束条件
及
下,求 li 使 Var(Yi)达到最大,由此 li 所确定的
称为 X1,X2,…,Xp 的第 i 个主成分。
1.2 总体主成分的计算
设 是的协方差矩阵,的特征值及相应的正交单位化特征向量分别为
及
则 X 的第 i 个主成分为
(3)
此时
1.3 总体主成分的性质
1.3.1 主成分的协方差矩阵及总方差
记 为主成分向量,则 Y=PTX,其中,且
由此得主成分的总方差为
即主成分分析是把 p 个原始变量 X1,X2,…,Xp 的总方差
分解成 p 个互不相关变量 Y1,Y2,…,Yp的方差之和,即
而 。
第 k 个主成分的贡献率:;
前m个主成分累计贡献率:,它表明前 m 个主成分Y1,Y2,…,Ym综合提供 X1,X2,…,Xp中信息的能力。
1.3.2 主成分 Yi 与变量 Xj 的相关系数
由于 Y=PTX,故 X=PY,从而
由此可得 Yi 与 Xj 的相关系数为
(4)
1.4 标准化变量的主成分
在实际问题中,不同的变量往往有不同的量纲,由于不同的量纲会引起各变量取值的分散程度差异较大,这时总体方差则主要受方差较大的变量的控制。为了消除由于量纲的不同可能带来的影响,常采用变量标准化的方法,即令
(5)
其中 这时
的协方差矩阵便是
的相关矩阵 ,其中
(6)
利用 X 的相关矩阵 作主成分分析,有如下结论:
设 为标准化的随机向量,其协方差矩阵(即 X 的相关矩阵)为 ,则 的第 i 个主成分为
(7)
并且
(8)
其中 为 的特征值,为相应于特征值 的正交单位特征向量。
第 i 个主成分的贡献率:;
前 m 个主成分的累计贡献率:;
与的相关系数为 。
二、样本主成分
前面讨论的是总体主成分,但在实际问题中,一般 (或)是未知的,需要通过样本来估计。设
为取自
的一个容量为n的简单随机样本,则样本协方差矩阵及样本相关矩阵分别为
(9)
其中
分别以 S 和 R 作为 和的估计,然后按总体主成分分析的方法作样本主成分分析。
三、 例 题
某市为了全面分析机械类个企业的经济效益,选择了8个不同的利润指标,14企业关于这8个指标的统计数据如下表所示,试进行主成分分析。
表1 14家企业的利润指标的统计数据
变量
企业序号 净产值利润率(%)
xi1 固定资产利润率(%)
xi2 总产值利润率(%)
xi2 销售收入利润率(%)
xi3 产品成本利润率(%)
xi5 物耗利润率(%)
xi6 人均利润率
xi7(千元/人) 流动资金利润率(%)
xi8 1 40.4 24.7 7.2 6.1 8.3 8.7 2.442 20.0 2 25.0 12.7 11.2 11.0 12.9 20.2 3.542 9.1 3 13.2 3.3 3.9 4.3 4.4 5.5 0.578 3.6 4 22.3 6.7 5.6 3.7 6.0 7.4 0.176 7.3 5 34.3 11.8 7.1 7.1 8.0 8.9 1.726 27.5 6 35.6 12.5 16.4 16.7 22.8 29.3 3.017 26.6 7 22.0 7.8 9.9 10.2 12.6 17.6 0.847 10.6 8 48.4 13.4 10.9 9.9 10.9 13.9 1.772 17.8 9 40.6 19.1 19.8 19.0 29.7 39.6 2.449 35.8 10 24.8 8.0 9.8 8.9 11.9 16.2 0.789 13.7 11 12.5 9.7 4.2 4.2 4.6 6.5 0.874 3.9 12 1.8 0.6 0.7 0.7 0.8 1.1 0.056 1.
您可能关注的文档
- 沈阳理工大学 模式识别和神经元网 2012版.doc
- 生物:《生态系统的功能》课件(新人教版必修3).ppt
- 石材发生自发性黄化的预防对策及其病变处理.doc
- 时间循环的应用.doc
- 实习指导书-Windows消息循环机制及其API程序设计.doc
- 实验二 MATLAB矩阵分析和处理.doc
- 实验四 循环结构程序设计(答案).doc
- 食品检验工选择题200题及其答案.doc
- 试论三国演义在人物描写上的特色1.doc
- 首师大附属丽泽中学2009-2010学年度第一学期期中考试.doc
- 专题1——微观结构和物质的多样性.doc
- 专业市场论文:专业市场共同配送系统的协调机制研究.doc
- 最常用的三种PCB板级信号完整性分析模型.doc
- 作业样本-好例子-陈宏子-关于中国的传统调解制度若干问题的研究85.doc
- ((人教版))[[初一数学课件]]初一数学《图形的平移和旋转》复习课件.ppt
- (北师大版)四年级数学下册课件_小数点搬家2.ppt
- (沪教版高二上)数学:第九章 矩阵与行列式初步(章综合).ppt
- (课标版)2011年高考政治一轮复习精品课件:经济生活 第十课 科学发展观与小康社会的经济建设.ppt
- (课件2)18.3频数分布表和频数分布图.ppt
- (生物)茂名市2008届高三第一次高考模拟考试.doc
最近下载
- 蒂森电梯LMS1称重装置诊断仪使用说明.doc
- 多式联运(冷链)综合物流枢纽信息化平台设施项目可行性研究报告模板-立项拿地.doc
- 实验室安全风险分级管控和隐患排查治理.docx VIP
- 国际减灾日---掌握防灾知识 保护生命安全 课件(共24张PPT).pptx VIP
- (新人教PEP版)英语六年级上册 Unit 1 大单元教学设计.docx
- 最新职业病防治知识考试题(附答案).docx VIP
- 精神科病区安全管理课件.pptx VIP
- 老年人社交活动组织与策划试题库及答案.doc VIP
- 2024年中海福建燃气发电有限公司人员招聘考试题库及答案解析.docx VIP
- 《妇产科护理》课件——女性生殖系统解剖.pptx VIP
文档评论(0)