主成分分析与因子分析详细的异同和SPSS软件.docxVIP

主成分分析与因子分析详细的异同和SPSS软件.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析与因子分析详细的异同和 SPSS 软件 摘要:主成分分析与因子分析(R-型)应用十分广泛,但一些论文和一些 SPSS 软件教科书(见附文)出错。本文指出了这些错误及其成因,指出了出错造成的危害,从原理上给出了主成分分析与 R-型因子分析数学模型详细的异同,给出了避免出错的方法, 并对 SPSS 软件及有关教科书提出了一些建议。 关键词:主成分分析;因子分析;SPSS 软件;出错;避免 =(X1 ,…,XP 为标准化随机向量(p≥2),R 为相关系数矩阵, = F1 ,…,Fm 为主成分向量, =(Z1 ,…,Zm 为因子向量,m≤p,为方便,因子、因子估计、因子得分用同一记号。 一、问题的提出与结论 主成分分析与 R-型因子分析是多元统计分析中的两个重要方法,同是降维技术,应用范围十分广泛,但通过流行甚广的 SPSS 软件调用这两种方法的过程命令,使用者容易出错,是什么原因造成这些错误呢?主成分分析与 R-型因子分析到底有何异同呢?出错会造成什么危害呢? 由于 SPSS 软件在经济、医学、管理等领域中的广泛流行使用,解决这些问题尤其必要。 经过对一些论文和一些 SPSS 软件教科书(见附文)仔细查证分析、比较、研究得出: 出错原因:有些使用者和书作者对主成分分析与 R-型因子分析的原理、异同与解题步骤掌握不透,现行 SPSS 软件及其书中没有完善这两种方法的研究(对高校师生出错影响很大)。 结论:主成分分析与 R-型因子分析有 10 处主要的不同,致使主成分分析与因子分析的定量综合评价体系不同,混淆在一起是不同定量值交替错误,综合评价必须分开进行。 出错带来的危害:企业经济效益、竞争力等的综合评价会带来误评,医学诊断会带来误诊,决策会带来误断等。 二、一些使用者出现的错误及其成因分析 经过仔细查证分析,有下列错误: 使用主成分分析时①对主成分分析的原理没有掌握, 如叙述主成分分 析概念出错。②主成分 F 求解出错,如=中( 为单位矩 阵,的意义见表 1)。③不知主成分 F 的命名依据,对主成分 F 命名出错。④解释变量某 Xk 被丢失。⑤对错误地进行旋转。⑥错误地进行回归 求 F 。⑦把因子分析法(含没有旋转过程的)错误地当作主成分分析法。 使用因子分析时①对因子分析的原理没有掌握, 如将因子分析的思想叙述为主成分分析的思想。②不知因子 Zi 的命名依据,对因子 Zi 的命名出错,如用因子得分函数对因子 Zi 进行命名。③解释变量某 Xk 被丢失。④将 主成分或因子错误地表示为 (的意义见表 1)。⑤不知相关系数矩 阵特征值 与因子贡献 vi 的区别,如综合因子得分函数 Z 综 = Zi 中的 vi 错误地取为特征值 。使用 SPSS 软件时①由于 SPSS 软件本身无主 成分分析模块,有些使用者就用因子分析中一些模块来制造主成分的结果,出现了混乱的定量过程。②由于 SPSS 软件教科书中因子分析内容处混淆主成分分析与因子分析,致使有些使用者也混淆这两种方法出错。 从以上可看出出错的原因是:有些使用者对主成分分析与 R-型因子分析的原理(原理可见[4])、异同与解题步骤掌握不透,现行 SPSS 软件及其书中没有完善这两种方法的研究。 三、主成分分析与 R-型因子分析数学模型的异同比较 这里给出的主成分分析与 R-型因子分析的异同,与现行观点相比,是内容与过程上的比较,更透彻、更准确,是认识的深入。 相同之处:主成分分析与 R-型因子分析都是对协差阵的逼近,都是打算降维解释数据集。具体为指标的正向化[3], 指标的标准化(SPSS 软件自动执行),通过相关系数矩阵判断变量间的相关性,求相关系数矩阵的特征值 和特征向量, 主成分间、因子间线性无关,用累计贡献率(%)、变量 不出现丢失确定主成分、因子个数 m, 前 m 个主成分与前 m 个因子对 X 的综合贡献相同、是最大化的,命名依据都是主成分、因子与变量的相关系数。 不同之处:方差, 最大化方向, 所处的坐标系(标准正交性), 应用上侧重等见表 1。 表 1 主成分分析与 R-型因子分析的不同 区别项 主成分分析数学模型: R-型因子分析数学模型: 目 表达式 + ( 为特殊因子), 与系数 矩阵 =( ) =( 因子载荷矩阵 = m = () …, ), , , 是相应的特征值和单位特征向 量, ≥…≥ ≥ 0。 =( …, ) 为初等因子载荷矩阵 ? ( 同 左)。 因变量 Fi 依次达到信息贡献最大化, Zi 没有达到最大化,Var Zi=1。 方差最 大化 Var Fi= 。 矩阵方 无, 旋转后就不是主成分了,因 有, 为 方差最大正 差最大 为 化旋转 Var Fi ≠λi 。 交旋转矩阵, m 达到方差最大 化

文档评论(0)

mmmttt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档