- 5
- 0
- 约1.82千字
- 约 5页
- 2021-06-09 发布于河北
- 举报
精品文档
一、 案例介绍
某运营商无线增值业务全国各省某一个月内运营情况, 变量 35 个,样本 31 个(全国 31 个省),
希望通过因子分析对各省综合实力进行排序。
二、 问题描述
通过 spss 的因子分析对原始变量进行降维处理时, SPSS提示相关系数矩阵为“非正定矩阵” ,
无法给出 KMO值,但是 SPSS仍然给出了后续因子分析结果。
三、 疑问
什么是正定矩阵?
因子分析是否一定要求变量的相关系数矩阵为正定矩阵?
非正定矩阵的存在对因子分析结果有何影响?
如何修正使得变成正定矩阵?
四、 解决办法
通过在论坛上查阅人相关问题,发现其他网友总结出现这种情况的原因主要集中在两点:
样本量太少,而指标过多
某些变量间相关性太强
而解决方案分别要求增加样本, 或者剔除某些显著强相关的变量, 但是在我的这个例子里面无
法增加样本, 因此只能从变量的相关性上考虑, 看是不是存在一些和其他变量高度相关的变量。
通过查看因子分析结果中的相关系数矩阵, 的确发现大部分变量之间都存在高度相关性, 而且
相关系数在 0.9 以上:
。
1 欢迎下载
精品文档
但是现在问题来了, 那是不是应该直接删除高度相关的变量?该删除哪些变量?按照我的情况
估计很多变量都要剔除了, 那对于分析结果就会产生很大的影响。 为了找出具体是哪些变量导致问
题的出现,我用了一个比较笨的办法:逐一淘汰法。刚开
原创力文档

文档评论(0)