- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析实例 例1:全国经济发展基本情况的指标主要有八项:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值,现收集有全国30个省市自治区的相关指标(见例),请用主成分分析方法选出适当的指标项。 2. 提取公因子和确定公因子数目 2. 提取公因子和确定公因子数目 分别将如上确定的成为原始数据的第一、第二、……第p主成分。在实际应用中,我们往往只需要能反映原始数据绝大部分信息的少数几个主成分即可,因此一般选取前面几个方差最大的主成分。 2. 提取公因子和确定公因子数目 基于上述基本原理,现将主成分模型的系数求解步骤归纳如下: (1)将原有变量数据进行标准化处理。 (2)计算变量的简单相关系数矩阵。 (3)求解协方差阵的特征根,并将特征值从大到小排序并重新编码: 2. 提取公因子和确定公因子数目 (4)按预先规定所取的P个公因子的累计方差贡献率达到的百分比m% 2. 提取公因子和确定公因子数目 (6)写出因子负荷阵 2. 提取公因子和确定公因子数目 选定提取因子方法的同时,还需确定所需提取的公因子的数目。其实在确定公因子数量的问题上,并无统一的原则来遵循,也无统一的标准来确定所应该有的公因子数目,一般来说,主要通过以下几个方面来确定公因子数量。 2. 提取公因子和确定公因子数目 (1)根据特征根来确定。特征根在某种程度上可以被看成是表示公因子影响力度大小的指标,如果特征根小于1,说明该公因子的解释力度还不如直接引入一个原变量的平均解释力度大。因此在SPSS中默认用特征根大于1作为纳入标准。 2. 提取公因子和确定公因子数目 (2)根据公因子的累积方差贡献率来确定。其实公因子的累积方差贡献率也就是前面在主成分分析中讲到的主成分的累积贡献率。一般来说,提取公因子的方差累积贡献率达到85%-90%以上就比较满意了,可以此决定需要提取多少个公因子。 2. 提取公因子和确定公因子数目 大量的实践表明,根据方差累积贡献率确定公因子数往往较多,而用特征根来确定又往往偏低,许多时候应当将两者结合起来,以综合确定合适的数量。其实在因子分析中,提取公因子数量的原则重点在于提取出的公因子的可解释性上,如果有实际意义,即使贡献率较小,也可以考虑保留。而如果特征根大于1,但是找不到合理的解释,则也可考虑将该公因子去除。 3. 公因子的命名解释 某个原始变量xi同时与几个公因子都有比较大的相关关系,即xi的信息要由若干个公因子共同解释;同时,虽然一个公因子能够解释许多原始变量的信息,但它都只是解释每一个原始变量的一部分信息,而不是任何一个变量的典型代表。这样在按照默认的分解方式,各因子可能难以找到所代表的实际意义 3. 公因子的命名解释 因子模型的一个特点:因子载荷阵不唯一,则可以利用这一特点对因子载荷矩阵进行适当的旋转,使公因子载荷系数向更大(向1)或更小(向0)方向变化,使得对公因子的命名和解释变得更加容易,但保持因子载荷矩阵A各行的元素的平方和即变量X的共同度不变。 实现以上目的是通过因子轴的旋转进行变换的。 3. 公因子的命名解释 设从公因子F旋转到公因子G,则模型变为: 是旋转后的因子模型,其中b11仍称为因子载荷。由旋转前后的模型比较可以看出旋转并不会影响公因子的提取过程和结果,只会改变原始变量的信息量在不同因子上的分布,即改变因子载荷阵。 3. 公因子的命名解释 常用的旋转方法可分为正交和斜交两大类。 在因子旋转过程中如果因子轴仍相互正交,则称为正交旋转。 如果因子轴之间不是相互正交的,则是斜交旋转。 进行正交变换可以保证变换后各因子仍正交,这是比较理想的情况。 3. 公因子的命名解释 常用的是方差最大化正交旋转(Varimax),它旋转的原则是各因子仍保持直角正交,但使得因子间方差的差异达到最大,即使得在每个因子具有较高载荷的变量个数最小化。 这种方法一般能简化对因子的解释。 3. 公因子的命名解释 但如果正交变换后对公因子仍然不易解释,也可以进行斜交旋转,或许可以得到比较容易解释的结果。 斜交旋转最常用的是倾斜旋转(Promax),这种方法是在方差最大化正交旋转的基础上进行斜交旋转,计算速度较快,旋转后允许因子间存在相关(交角非直角)。 3. 公因子的命名解释 在对因子矩阵进行旋转以后,就必须给不同的因子进行命名。 因子命名有一些原则: (1)因子分析的命名必须简明、用尽量少的词(2~3个)去解释因子。 (2)必须要注重不同因子荷载高的变量之间的相似性 (3)可以根据因子中包含什么样的变量来给因子命名。 4. 计算因子得分 在因子分析中,还可以将公因子表示为原始变量的线性组合,这样就可以从原始变量的观测值估计各个公因子的
文档评论(0)