- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第五节主成分分析方法
PrincipalComponentAnalysis(PCA)主成分分析的基本原理主成分分析的计算步骤主成分分析方法应用实例问题的提出:多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。01主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。01从数学角度来看,这是一种降维处理技术。01假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵1()2一、主成分分析的基本原理当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。(3.5.2)系数lij的确定原则:zi与zj(i≠j;i,j=1,2,…,m)相互无关;定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标010204030102z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;……zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP,的所有线性组合中方差最大者。则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分。01从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的荷载lij(i=1,2,…,m;j=1,2,…,p)。02从数学上可以证明,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量。计算相关系数矩阵rij(i,j=1,2,…,p)为原变量xi与xj的相关系数,rij=rji,其计算公式为:01()01()01二、计算步骤解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列;分别求出对应于特征值的特征向量1,要求=1即,其中表示向量的第j个分量。2(二)计算特征值与特征向量:计算主成分贡献率及累计贡献率贡献率:累计贡献率:一般取累计贡献率达85—95%的特征值所对应的第一、第二、…、第m(m≤p)个主成分。表明取前几个主成分基本包含了全部测量指标所具有信息的百分率。3124主成分的方差贡献率:这个值越大,表明第i主成分综合信息的能力越强。主成分的累计贡献率六、主成分模型中各统计量的意义0102累积贡献率达到85%以上根据特征根的变化来确定七、主成分个数的选取计算主成分载荷各主成分的得分:()()010203八、主成分分析的基本步骤及spss实现将原始数据进行标准化处理计算样本相关矩阵R求相关矩阵R的特征值与特征向量,并计算贡献率选择主成分对所选主成分做经济解释analyze-descriptionstatistic-description-savestandardizedasvariablesanalyze-datareduction-factor指定参与分析的变量运行factor过程Spss实现:从系数的大小、系数的符号上进行分析。系数绝对值较大,则表明该主成分主要综合了绝对值大的变量。正号表示变量与主成分作用同方向,负号表示原变量与主成分作用反方向。如果变量分组较有规则,则从特征向量各分量数值作出组内组间对比分析。九、解析主成分的实际经济意义三、主成分分析方法应用实例我们根据表给出的数据,对某农业生态经济系统做主成分分析,表3.4.5某农业生态经济系统各区域单元的有关数据步骤如下:(1)将表中的数据作标准差标准化处理,然后将它们代入公式()计算相关系数矩阵(见表)。表相关系数矩阵由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表)。由表可知,第一,
您可能关注的文档
- 主管能力德信诚培训.ppt
- 云南省临沧市民族中学普光荣.ppt
- 人教版二年级下册《雷雨》.pptx
- 三年级写水果作文指导课件.ppt
- 五大症状早期判断宝宝肠套叠.pptx
- 人教版三年级上册海滨小城ppt.pptx
- 一年级看图写话集(完整版有例文).ppt
- 一般现在时模板导图.ppt
- 七年级道德与法治少年有梦PPT.ppt
- 人教版小学四年级语文下册古诗词三首.ppt
- 中国新能源锂电行业市场深度评估及投资方向研究报告.docx
- 2024-2030年中国欢爱胶囊项目投资风险分析报告.docx
- 2024-2030年中国欧式中空卷门产业未来发展趋势及投资策略分析报告.docx
- 2025-2031年中国建筑结构设计软件行业发展运行现状及发展趋势预测报告.docx
- 2024-2030年中国欧式厨柜产业未来发展趋势及投资策略分析报告.docx
- 2024-2030年中国欧式车库用卷帘门产业未来发展趋势及投资策略分析报告.docx
- 中国网络服务器行业市场全景评估及投资策略咨询报告.docx
- 2024-2030年中国欧米伽3行业深度调查及投资价值分析报告.docx
- 2024-2030年中国欧米茄6多不饱和脂肪酸行业需求态势与营销前景预测报告.docx
- 中国室外壁灯行业市场发展监测及投资战略规划研究报告.docx
文档评论(0)