- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
探索性因子分析是社会科学、管理学、心理学等领域中常用的数据降维与结构探测方法。其核心目标之一,就是从一组观测变量中提取出少数几个潜在的“因子”,以简化数据结构、揭示变量间的内在关联。而确定因子的数量,是因子分析中至关重要的一步,选多或选少都会影响结果的解释效度。
本文将以一份实际的SPSSAU输出结果为例,系统介绍五种常用的因子数量确定方法,并附上清晰的流程图与解读,帮助你彻底理解这一关键环节。
一、什么是探索性因子分析?
探索性因子分析旨在识别观测变量背后的潜在结构,通过“因子”来表示变量之间的共同方差。我们通常希望用尽可能少的因子,解释尽可能多的原始信息。而“因子数量”的确定,既依赖统计指标,也离不开研究者的理论洞察。
下面我们用一个综合流程图来概括因子数量判断的整体过程:
流程图解读:确定因子数量是一个多步骤、多依据的综合过程。我们首先需要检验数据是否适合做因子分析(KMO与Bartlett检验),通过后,再依次运用特征根大于1准则、方差解释率、碎石图等统计工具进行初步判断,最后必须结合理论知识和因子载荷矩阵的实际含义进行微调,才能确定最终的因子数量。
二、数据基础与适用性检验
在进行因子数量判断之前,必须确保数据适合进行因子分析。我们使用SPSSAU对一组包含6个指标的铁路运输数据进行分析,输出结果如下:
KMO值为0.722,介于0.7~0.8之间,属于“比较适合”进行因子分析的范围,表明变量间存在足够的共性方差。Bartlett球形检验的p值小于0.001,强烈拒绝变量间独立的原假设,进一步支持因子分析的适用性。
三、确定因子数量的五种方法详解
方法一:特征根大于1准则
特征根反映了因子可解释的原始变量方差量。特征根大于1,意味着该因子能解释的信息超过单一原始变量,通常被保留。
从SPSSAU输出的“方差解释率表格”中,我们提取出以下关键信息:
分析解读:根据特征根大于1准则,前2个因子的特征根均大于1(分别为3.666和1.063),而第3个因子的特征根为0.632(1),因此应提取2个因子。这2个因子旋转后的累积方差解释率达到78.808%,意味着它们能解释原始数据近八成的变异,信息保留程度非常理想。
方法二:方差解释率法
方差解释率反映了每个因子对总方差的贡献程度。我们通常希望保留的因子能共同解释大部分方差(通常建议60%以上),但同时也要考虑因子的简洁性和可解释性。
从同一表格可见,提取2个因子时,累积方差解释率为78.808%,已远超一般研究的可接受标准。若提取3个因子,累积解释率虽增至89.344%,但第3个因子的特征根仅为0.632(1),且新增解释率(10.536%)主要来自统计噪音而非真实信息。从简洁性和可解释性原则出发,提取2个因子更为合适。
SPSSAU的优势体现:软件自动根据特征根大于1准则提取出2个因子,并在智能分析中明确提示“如果因子提取个数与预期不符,可在分析时主动设置因子个数”。这种灵活性让研究者既能依赖统计准则,又能融入专业判断。
方法三:碎石图检验
碎石图通过图示化方式展示特征根的下降趋势,以直观的形式辅助判断因子数量。我们通过另一个流程图来理解碎石图的判读逻辑:
SPSSAU输出碎石图如下:
在本次分析的碎石图中,第1个因子的特征根下降极为显著,第2个因子后曲线变得明显平缓。这个“拐点”位于第2个因子处,符合典型的碎石图判读标准。SPSSAU提供的碎石图可视化效果清晰,便于用户直观判断因子提取的合适数量。
方法四:因子载荷矩阵判读
确定因子数量后,还需检查“旋转后因子载荷系数矩阵”,确保每个因子都有若干题项在其上有较高载荷(通常0.5),且因子结构清晰、易于解释。
本次分析中,Varimax旋转后的因子载荷矩阵显示:
因子1:主要载荷在铁路货运总量(0.916)、铁路货物总周转量(0.809)、铁路营业里程(0.762)上,反映“货运能力与基础设施”维度。
因子2:主要载荷在铁路客运量(0.875)、铁路旅客周转量(0.866)上,反映“客运服务规模”维度。
交叉载荷情况:铁路运输职工人数在两个因子上均有中等载荷(0.589和0.616),这符合实际情况——职工人数同时服务于客运和货运业务。
分析解读:两个因子的结构清晰,业务含义明确,所有变量的共同度均高于0.7,说明因子提取效果很好。如果提取3个因子,反而会导致因子结构碎片化,难以合理解释。
方法五:理论一致性原则
统计方法固然重要,但因子结构的最终确定必须结合研究理论和实际意义。即使统计指标支持提取更多因子,若新增因子无法从理论角度合理解释,也应谨慎考虑。
在本例中,铁路运输系统的经典理论通常区分客运和货运两大业务板块,这与提取出的2个因子高度吻合。从业务逻辑看:
因子1(货运能力与基础设施):涵盖货运量、货物周转量、营业
原创力文档


文档评论(0)