- 22
- 0
- 约1.58千字
- 约 4页
- 2016-12-01 发布于重庆
- 举报
因子分析出現非正定矩阵案例
案例介绍
某运营商无线增值业务全国各省某一个月内运营情况,变量35个,样本31个(全国31个省),希望通过因子分析对各省综合实力进行排序。
问题描述
通过spss的因子分析对原始变量进行降维处理时,SPSS提示相关系数矩阵为“非正定矩阵”,无法给出KMO值,但是SPSS仍然给出了后续因子分析结果。
疑问
什么是正定矩阵?
因子分析是否一定要求变量的相关系数矩阵为正定矩阵?
非正定矩阵的存在对因子分析结果有何影响?
如何修正使得变成正定矩阵?
解决办法
通过在论坛上查阅人相关问题,发现其他网友总结出现这种情况的原因主要集中在两点:
样本量太少,而指标过多
某些变量间相关性太强
而解决方案分别要求增加样本,或者剔除某些显著强相关的变量,但是在我的这个例子里面无法增加样本,因此只能从变量的相关性上考虑,看是不是存在一些和其他变量高度相关的变量。
通过查看因子分析结果中的相关系数矩阵,的确发现大部分变量之间都存在高度相关性,而且相关系数在0.9以上:
但是现在问题来了,那是不是应该直接删除高度相关的变量?该删除哪些变量?按照我的情况估计很多变量都要剔除了,那对于分析结果就会产生很大的影响。为了找出具体是哪些变量导致问题的出现,我用了一个比较笨的办法:逐一淘汰法。刚开始时不把所有变量都用来做因子分析,只选取一小部分,例如我先选取了10个变量做分析,发现spss没有再提示“非正定矩阵”
原创力文档

文档评论(0)