- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
维普资讯
第21卷第5期 统 计 与 信 息 论 坛 Vol1.21No.5
2006年9月 Statistics InformationForum Sept.,2006
统【计理论与方法】
多指标综合评价中
主成分分析和因子分析方法的比较
王文博,陈秀芝
(西安交通大学 经济与金融学院,陕西 西安 710061)
摘要:文章通过对主成分分析和因子分析在研究 目的、分析原理、SPSS软件实现过程方面的比较,指出在
多指标综合评价时应用两种方法应该注意四个问题 ,以正确地进行实证研究。
关键词:主成分;因子;区别
中图分类号:0 12.4 文献标识码:A 文章编号:1007—3116(2006)05—0019—04
1901年由KarlPerason引进,对非随机变量讨论,
一 、 问题的提 出
1933年数学家Hotelling把它推广到随机向量 【卜 。
在多元统计分析中,主成分和因子分析是两种 这种方法的思想就是把相关联的原始变量用不相关
很重要的数据降维方法。随着两种方法不断被研究 的新变量表示,表示方式为线性组合;出于简化数据
推广,它们越来越多地被应用于实证分析尤其是多 的目的,选取新变量个数少于原始变量个数,被选取
指标综合评价中。但是由于对两种方法的原理理解 的新变量就是 “主成分”。选取的原则是不丢失主要
不透彻,对统计软件SPSS中两种方法的实现过程 信息,衡量信息量的指标是主成分的方差,方差越
不清楚,导致在实际应用时错误使用输出结果,使定 大,说明主成分包含的信息量越大。
量分析出现偏差。 (2)主成分分析的原理。理解主成分分析的原
理需要特别注意以下两个方面:
二、主成分分析和因子
其一,数学模型及其统计特征:
分析的区别、联系 Fml=A xpl,为保证线性组合的系数确
首先假定 x是已经标准化的P维随机向量,因 定、唯一,模型需要满足:
此 x的协差阵和相关系数阵是同一的,用 R表示; (I)Cov(Fi, ):0,即各个主成分之间互不
是R的第i大特征根, 对应的单位特征向量P组 相关 ;
成的矩阵为Epp= (Pl’P2,·.-, ),F是 m维主成 (Ⅱ)Var( )= , 是R的第 大特征根;主
分向量,z是 m维公共因子向量,拿是特殊因子向量。 成分的形成顺序按照方差大小排列,即第一主成分
主成分分析和R型因子分析都是对变量降维, 方差最大,第二主成分方差第二大,依次类推;
分析的对象相同,所以本文主要讨论主成分分析和 (Ⅲ)A ,A =I ,即系数阵是单位阵。
R型因子分析的区别和联系。 其二,系数阵的特征和估计。应用主成分模型的
(一)主成分分析和因子分析简介 关键是估计系数阵A 。多元统计学已经证明:
1.主成分分析 A × =(Pl,P2,…,P ),P是R的特征根 对
(1)发展历史和研究 目的。主成分概念最早在 应的单位特征向量。
收稿 日期:2006—03—16
作者简介:王文博(1953一),男,陕西省西安市人 ,教授,硕士生导师,研究方向:计量经济模型与应用 、经济预测与决策;
陈秀芝(1981一),女,天津市
文档评论(0)