6-3因子分析wcm2.docVIP

  • 31
  • 0
  • 约6.56千字
  • 约 11页
  • 2016-02-24 发布于江苏
  • 举报
6-3因子分析wcm2.doc

6.3 因子分析 因子分析是最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。 因子分析的主要目的是隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量 (latent variable, latent factor)因子。比如,如果要测量学生的学习积极性 (motivation),课堂中的积极参与,作业完成情况,以及课外阅读时间可以用来反应积极性。而学习成绩可以用期中,期末成绩来反应。在这里,学习积极性与学习成绩是无法直接用一个测度 (比如一个问题) 测准,它们必须用一组测度方法来测量,然后把测量结果结合起来,才能更准确地来把握。7门功课,政治、语文、外语以及数学、物理、化学、生物。考分是7维随机变量:。一般认为,政治、语文、外语都是反映学生的文科能力与水平;数学、物理、化学、生物都是反映学生的理科能力与水平。也就是说,七门功课主要是由两个因子所决定的,于是可以建立一个数学模型 注意此时尚未抽样。模型里是已知的,为常数向量(有的参考书将吸收到中去而简化模型)与都是未知的,不仅未知,而且此时尚无法度量,只假设是表示文科能力与水平,表示理科能力与水平;是随机误差项。我们首先要问这样的模型是否合理,为什么是2个因子而不是3个因子;其次我们需要估计出、及其它模型参数。对比一般多元线性回归模型在未抽样前的随机变量形式 这里、都是已知的,是待估的,大家就知道因子分析模型困难之所在了。 因子分析的内容十分丰富,本章仅介绍因子分析常用的两种类型:R型因子分析(对变量作因子分析)和Q型因子分析(对样品作因子分析)。 6.3.1 正交因子模型 1 正交因子模型 对于有p个指标的总体,因子分析的基本思想如下: 我们要找的综合指标称为公因子,设有m个(),分别用表示,它们的值是未知的。假设第个样本的观测值是在这m个公因子上的得分的线性组合加上各自的特殊因子构成 用矩阵表示: 则关于所有样本或总体的正交因子分析数学模型可用矩阵表示为 且满足: 1) ii) 即F和是不相关的; iii)即不相关且方差皆为1。 即不相关,且方差不同。 其中aij称为因子载荷是第i个变量在第j个公共因子上的负荷,如果把变量Xi看成m维因子空间中的一个向量,则表示Xi在坐标轴Fj上的投影,矩阵A称为因子载荷矩阵;称为X的特殊因子,通常理论上要求的协方差阵是对角阵,中包括了随机误差。 由上述模型满足的条件可知:是不相关的。若相关时,则D(F)就不是对角阵,这时的模型称为斜交因子模型,本章将不讨论这种模型。 因子分析和主成分分析有很多相似之处,在求解过程中二者都是从一个协方差阵(或相似系数阵)出发,但这两种模型是有区别的,主成分分析的数学模型实质上是一种变换,而因子分析模型是描述原指标X协方差阵结构的一种模型,当时,主不能考虑,此时因子分析也对应于一种变量变换,但在实际应用中,m都小于p,且为经济起见总是越小越好。另外在主成分分析中每个主成分相应的系数是唯一确定的,即因子载荷阵不是唯一的,若为任一个阶正交阵,则因子模型可写成:,仍满足约束条件,即,所以也是公共因子,也是因子载荷阵。因子载荷的不唯一性,从表面上看是不利的,但后面将会看到当因子载荷阵A的结构不够简化时,可对A实行变换以达到简化目的,使新的因子更具有鲜明的实际意义。从因子分析的数学模型上看,它与多变量回归分析也有类似之处,但本质的区别是因子分析模型作为“自变量”的f是不可观测的。 因子载荷的统计意义 为了便于对因子分析计算结果做解释,将因子分析数学模型中各个量的统计意义加以说明是十分必要的。 假定因子模型中,各个变量以及公共因子、特殊因子都已经是标准化(均值为0,方差为1)的变量。 根据因子分析模型的假定可知 由于Xi已标准化了,有,所以因子载荷的统计意义就是第i个变量与第j个公共因子的相关系数即表示Xi依赖Fj的份量(比重)。因此用统计学的术语应该叫作权,但由于历史的原因,心理学家将它叫做载荷,即表示第i个变量在第j个公共因子上的负荷,它反映了第i个变量在第j个公共因子上的相对重要性。 同理由因子分析的定义可知 令反映了m个公因子在的方差项中所占比例,其大小反映了对于m个公因子的依赖程度的大小,称为共性方差。它体现全部公共因子对变量Xi的总方差所作的贡献,越接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,如则说明Xi的97%的信息被m个公共因子说明了,也就是说由原始

文档评论(0)

1亿VIP精品文档

相关文档