《SPSS数据分析教程》——主成分分析.ppt

《SPSS数据分析教程》——主成分分析.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《SPSS数据分析教程》 ——主成分分析 主成分分析 目录 11.1 主成分分析简介 11.1.1 主成分分析的目的与功能 11.1.2 主成分分析的数学理论 11.2 主成分分析的应用条件 11.2.1 Bartlett球形检验 11.2.2 KMO统计量 11.2.3 基于相关系数矩阵还是协方差矩阵 11.3 主成分分析案例 11.3.1 综合评价案例 11.3.2 主成分分析用于探索量间结构关系 本章学习目标 了解主成分分析的应用领域; 了解主成分析的应用条件; 掌握如何确定主成分的个数; 熟练解释主成分分析的结果:载荷矩阵、共同度、方差贡献率等; 掌握应用主成分分析进行数据降维和综合评价的方法。 11.1 主成分分析简介 主成分分析的目的与功能 在多变量分析中,分析者所面临的最大难题是解决众多变量之间的关系问题。进行数据降维可以用尽可能少的新指标取代原来较多的指标变量,并能包含原来指标变量所包含的大部分信息 。 解决多元回归分析中的多重共线性问题。 综合评价中,人们总是尽可能多地选取评价指标,而这些评价指标之间往往相互重叠,信息冗余是不可避免的。主成分分析则可以把这众多指标所蕴含的信息压缩到少数几个主成分指标,然后给出这几个主成分指标的权重,综合到一个评价指标中。 主成分的主要功能 数据降维(Dimension Reduction) 变量筛选(Variables Screening) 主成分分析的算法步骤 第1步:进行样本数据的标准化,以消除指标变量的量纲或者单位的影响。 第2步:求出相关系数矩阵R的所有非零特征根 第3步:选择主成分个数。 第4步:求出相应于前s个特征根的特征向量并将特征向量进行单位化。 第5步:计算主成分变量的取值。 选择主成分个数的方法 给出方差贡献率?,即给出希望得到的全部信息的比例。要求输出能够反映全部信息的100?%的主成分。 根据碎石图选择合适的主成分的个数 。 设定特征值满足的条件或者直接给出所需要的主成分的个数s 。 共同度和方差贡献率 共同度:前s个主成分能够解释的每个原始变量的方差的比例(称为共同度)。 方差贡献率:它是每个主成分所能够解释的所有原始变量的信息(即方差),它由载荷矩阵(特征向量矩阵,即方程11-4)相应的列元素的平方和给出。 11.2 主成分分析的应用条件 Bartlett球形检验(1) 主成分分析的原始变量之间必须有相关性,如果变量之间相互独立,则无法用主成分分析法来进行数据降维。 Bartlett球形检验的假设为 原假设:相关系数矩阵为单位矩阵(即变量互不相关)。 备择假设:相关系数矩阵不是单位矩阵(即变量之间有相关关系)。 Bartlett球形检验(2) SPSS将提供Bartlett球形检验的卡方统计量的值、相应的自由度和显著性值。如果显著性值小于0.05,则认为主成分分析是适宜的。卡方统计量的值越大,变量之间的相关性越强。 KMO统计量 (1) KMO统计量比较样本相关系数和样本偏相关系数,它用于检验样本是否适于作主成分分析。 KMO统计量的取值在0和1之间,该值越大,则样本数据越适于作主成分分析和因子分析。一般要求该值大于0.5,方可以应用主成分分析或者相关分析。 KMO统计量 (2) 基于相关系数矩阵还是协方差矩阵 当变量取值范围变化很大或者量纲变化时,协方差矩阵变化很大。一般情况下,主成分分析都是基于相关系数矩阵的。 主成分分析案例 (1) 打开本章数据文件PCA20.sav 某公司有20个工厂,现在要对每个工厂作经济效益分析。从所取得的生产成果和所消耗的人力、物力、财力的比率等指标中,选取5个指标(变量)进行分析。 X1——固定资产的产值率; X2——净产值的劳动生产率; X3——百元产值的流动资金占用率; X4——百元产值的利润率; X5——百元资金的利润率。 主成分分析案例(2) 现在对这20个工厂同时按照这5项指标收集数据,然后找出1个综合指标对它们的经济效益进行排序,找出经济效益较高的工厂。 应用主成分分析法,要求主成分只要能够反映出全部信息的85%就可以了。 主成分分析案例 (3) 选择【分析】→【降维】→【因子分析】,把变量X1到X5都选到“变量”框中。 主成分分析案例 (4) 因子的旋转 主成分分析得到的主成分不一定要给出有意义的解释,不需要进行因子旋转。但是,因子分析一般需要给出因子有意义的解释,如果直接得到的因子载荷没有实际解释意义,则必须进行因子旋转。 主成分输出结果解释和主成分的计算 主成分适用条件的检验。 检查KMO和Bartlett检验结果,判断主成分分析(或者因子分析)是否适用。 解释共同度、方差贡献率和因子载荷矩阵。 碎石图 成分矩阵 成分矩阵不能够直接作为主成分

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档