- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 2
第四章 因子分析
§4.1 概 述
1 因子分析概念
因子分析(Factor Analysis)是多元统计分析技术的一个分支,其主要目的是浓缩数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,我们把这些假想变量称之为基础变量,即因子(Factors)。
因子分析:就是研究如何以最少的信息丢失把众多的观测变量浓缩为少数几个因子的多元分析方法。
2、因子分析的应用
例,某快餐店为了解其市场竞争能力进行消费者调查,通过定性研
究设计了30个有关快餐店及其产品和服务的调查项目。
(1)寻求基本结构
这30个项目可能反映了快餐的质量、价格、就餐环境和服务四个基本方面,通过因子分析我们能找出反映数据本质特征的这四个因子并分析原来30个观测变量和它们之间的关系。
(2)数据化简(Data reduction)
通过因子分析把一组观测变量化为少数的几个因子后,可以进一步将原始观测变量的信息转换成这些因子的因子值,然后,用这些因子代替原来的观测变量进行其他的统计分析,如回归分析、路径分析、判别分析和聚类分析等,利用因子值也可以直接对样本进行分类和综合评价。
(3) 解决共线性问题
3因子分析分类
探测性(Exploratory)因子分析 探索基础变量的维数
证实性(Confirmatory)因子分析 检验理论或先验知识假设
§4.2 因子分析原理
因子分析模型
1、模型
因子分析模型在形式上和多元回归模型相似,每个观测变量由一组因子的线性组合来表示。设有k个观测变量,分别为,
则因子模型的一般表达形式为:
…. …… …..
写成矩阵形式:
其中:为具有零均值、单位方差的标准化变量。
2、基本概念
(1)叫做公因子(Common factors),它们是各个观测变量所共有的因子,解释了变量之间的关系。
(2)ui称为特殊因子(Unique factor),它是每个观测变量所特有的因子。(相当于多元回归中的残差项,表示该变量不能被公因子所解释的部分。)
(3)aij称为因子负载(Factor loadings),它是第i个变量在第j个公因子上的负载。(相当于多元回归分析中的标准回归系数)().
因子分析模型也可以用路径分析图表示如图4–1。
a2ma11a21ak
a2
a11
a21
ak1
a12
a22
ak2
a1m
akm
f2 u2
fm xk u
图4—1 因子分析路径图
3、模型假设
①设该模型m个特殊因子之间是彼此独立的,特殊因子和公因子之间也是彼此独立的。
②经过变换(为的均值,为的标准差)成为标准化变量。经标准化变换不改变变量之间的相关系数。
4、因子分析模型说明
1每一个观测变量x,由m个公因子f和一个特殊因子u的线性组合来表示;
2公因子f的个数最多可以等于观测变量数k, 即:m≤k
3如果把特殊因子作为残差项看待,因子分析模型和多元线性回归方程在形式上很相近;
4回归模型中的自变量是可观测的,而因子分析模型中的因子是假想变量,是不可观测的。
二、因子分析中的有关指标
1、因子负载
aij等于第i个变量和第j个因子之间的相关系数。aij的绝对值越大,表示公因子fj与变量xi关系越密切。大多数情况下,人们往往假设公因子之间是彼此正交的(Orthogonal),即不相关的。
例: 五个观测变量、两个公因子的模型:
x1=0.9562f1+0.2012
x2=0.8735f1+0.2896
x3=0.1744f1+0.8972
x4=0.5675f1+0.7586
x5=0.8562f1+0.3315f
容易看出,公因子f1与变量x1,x2,x5关系密切,它主要代表了这些变量的信息;公因子f2与变量x3,x4关系密切,它主要代表了这两个变量的信息。
因子负载还可以用来估计观测变量之间的相关系数,例xi和xj之间的相关系数为:
即任何两个观测变量之间的相关系数等于对应的因子负载乘积之和。
即任何两个观测变量之间的相关系数等于对应的因子负载乘积之和。
f1aj1ai1ai2aj2aimajmfmxiX
f1
aj1
ai1
ai2
aj2
aim
ajm
f
文档评论(0)