演示专题6:因子分析.DOC

演示专题6:因子分析.DOC

专题5:因子分析 1 因子分析问题 2 因子分析的数学模型 3 因子分析所需的原始数据 4 主要统计结果及解释 5 因子分析例题 6 应用举例 7 几点说明 1 因子分析问题 设有p个变量x1、x2、…xp,若这p个变量是相关的,那么一定存在着一些影响因素,同时对不同的变量有影响,即这p个变量具有一些公共的影响因素,我们称之为公共因子,简称为因子。 因子分析就是要找出这些公共因子,以便对事物进行分析和控制。这些因子通常是不可观测的,也不能真正求得,但我们可以求出这些因子与xi的关系(如相关系数等),从而可以对这些因子进行分析。 通常,公共因子的数量比原始变量的个数要少得多,因此用分析公共因子来代替逐个分析原始变量,虽然会损失一部分信息,但能起到降维作用。 例 考虑各地区居民的两周患病率(x1)、每千人两周患病天数(x2)、每千人两周因病休工天数(x3)三个变量,经过计算,我们可以找出它们的一个公共因子f,该因子与各变量的相关系数如下: 变量 与因子f 的相关系数 x1:两周患病率 0.9629 x2:每千人两周患病天数 0.7969 x3:每千人两周因病休工天数 0.6445 从这些相关系数中我们可以推知,因子f 反映的是“居民体质”。因为: 两周患病率除了一些偶然因素外,主要与健康水平有关,所以两者相关程度非常高; 每千人两周患病天数除了与居民健康水平有关外,还与能否及时得到治疗及治疗水平(这构成影响x2的特殊因子)有关,所以相关程度稍低; 每千人两周因病休工天数除了与居民健康水平有关外,还与当地医疗条件、居民的职业构成(这构成影响x3的特殊因子)有关,所以相关程度更低些。 返回 2 因子分析的数学模型 2.1 计算的出发点 2.2 模型简介 返回 2.1 计算的出发点 因子分析模型有多种求解方法,即有多种提取因子的方法,体育领域中使用较多的为“主成分法”,下面我们针对用主成分法提取因子进行介绍。 与主成分分析一样,因子分析也有用原始变量还是用标准化变量建立模型的问题,分别对应于用协差阵计算和用相关阵计算。 体育领域中通常都用标准化变量建立模型,即用相关阵计算。 下面内容都是针对以标准化变量建立模型的,并且只考虑正交因子(即要求因子间相互独立、互不相关)。 返回 2.2 模型简介 因子分析的数学模型(因子模型)为: (m ≤ p) 其中: ① x1、x2、…xp为p个标准化变量,是我们要研究的原始变量的标准化形式。 ② f1、f2、…fm为m个公共因子。fj 相互独立(即f1、f2、…fm为一组正交因子),是不可观测的理论变量,并且也是标准化变量。 ③ ε1、ε2、…εp 称为特殊因子。εi 是xi 特有的影响因素,εi 相互独立,并且εi 与fj 之间也相互独立。(i=1、2…p , j=1、2…m) ④ aij 称为公共因子fj 在xi 上的载荷量,简称“因子载荷”或“载荷”。 在①、②、③的条件下,aij恰好是xi与fj的相关系数。显然aij的绝对值越大,xi 与fj 的关系越密切。 矩阵 称为“因子载荷矩阵”,简称为“载荷矩阵”,也称为“因子矩阵”,其每一行对应一个变量,每一列对应一个因子。 求解因子分析模型,也就是求因子载荷矩阵。有了因子载荷矩阵,就可以对各因子的含义进行分析。 返回 3 因子分析所需的原始数据 因子分析的原始数据与主成分分析的相同。 如要对p个变量x1、x2、…xp作因子分析,则需抽取一个样本,测取样本中每个观察对象的x1、x2、…xp的值,注意每个对象各指标的值都要测全。 因子分析中的原始变量地位都相同,没有自变量与因变量之分,变量的排列顺序也不会对结果产生实质性影响。 返回 4 主要统计结果及解释 4.1 相关阵 4.2 KMO取样适当性度量和巴特莱特球度检验 4.3 (初始)因子载荷矩阵 4.4 因子的方差贡献 4.5 变量的共同度(共性方差) 4.6 旋转的因子载荷矩阵 4.7 因子得分 返回 4.1 相关阵 相关阵是参与分析的变量两两间相关系数构成的矩阵,因子分析首先要计算出变量的相关阵,然后在相关阵的基础上进一步计算。 返回 4.2 KMO取样适当性度量 和巴特莱特球度检验 取样适当性的Kaiser-Meyer-Olkim(KMO)度量是用于衡量一组变量的相关程度的,其值介于0~1之间。 当整体上偏相关系数平方和相对于相关系数平方和较小时,KMO值接近于1,这时资料适合于作因子分析,反之则不适合于作因子分析。 Kaiser(1974)是这样刻划这一度量的[4]: 0.9以上:极好的 0.8-0.9之间:可嘉的 0.7-0.8之间:较好的

文档评论(0)

1亿VIP精品文档

相关文档