第五章因子分析.doc

PAGE 0 PAGE 1 第 页 注意电子文档使用范围 注意电子文档使用范围 注意电子文档使用范围 注意电子文档使用范围 《多 元 统 计 分 析》 Multivariate Statistical Analysis 统计学院应用统计学教研室 第五章 因子分析 【教学目的】 让学生了解因子分析的背景、基本思想; 掌握因子分析的基本原理与方法; 掌握因子分析的操作步骤和基本过程; 学会应用因子分析解决实际问题。 【教学重点】 因子旋转与因子得分; 因子分析与主成分分析的联系与区别。 §1 概述 引言 1.问题提出(研究背景) 在上一章,已经介绍了一种简化数据结构的方法——主成分分析法。其基本目的是从尽可能多地占有原始数据的总变差出发来构造少数变量的线性组合变量——综合变量。本章来讨论另外一种简化数据结构的方法——因子分析,它不同于主成分分析,可以看成是其推广形式。 在经济学、人口学、社会学、心理学、教育学等领域中,有许多基本特征,例如:“态度”、“认识”、“爱好”、“能力”、“智力”等,实际上是不可直接观测的量。但是这些基本特征常常对事物的结果起着决定性作用。比如学生通过考试得到英语、高等数学、大学物理、计算机、统计学、多元统计、数理统计、经济学等课程的成绩。把每门课的成绩看作一个变量,显然这些变量必定受到一些共同因素的影响,比如全面智力,或者细分一点,如逻辑思维能力,形象思维能力和记忆力等,都是影响这些课程成绩的公共因素。另外,每门课程的成绩还可能受自己特点因素的影响,如英语的语言能力、大学物理的动手实验能力、高等数学的推理能力等。 2.因子分析的产生 1904年Charles Spearman发表《对智力测验得分进行统计分析》一文,标志着因子分析方法的产生。因子分析最早用于心理学和教育学方面的研究,目前广泛应用于各领域。 3.什么是因子分析 因子分析就是要利用少数几个潜在变量或公共因子去解释多个显在变量或可观测变量中存在的复杂关系。换句话说,因子分析是把每个原始(可观测)变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子构成的;另一部分是每个原始变量独自具有的因素,即所谓的特殊因素部分或特殊因子部分。正是特殊因子的存在,才使一原始变量有别于其它原始变量。属于多元统计分析中处理降维的一种统计方法。由此可知,因子分析注重的是因子分析的具体形式,而不考虑各变量的变差贡献大小。 例如,某公司对100名招聘人员的知识和能力进行测试,出了50首题的试卷,其内容包括的面较广,但总的来讲可以归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中的因素 因子是一种比较抽象的概念,后者具有极为明确的经济意义。。现假设100人测试的分数可以用上述六个因子表述为线性函数: 因子是一种比较抽象的概念,后者具有极为明确的经济意义。 因子模型与回归模型在形式上相同,在实质上不同: 因子模型与回归模型在形式上相同,在实质上不同:①是抽象因子,不是变量,其值不可直接观测;②参数的统计意义不一样。 其中,表示六个因子,它对所有是共有的因子,通常称为公共因子 公共因素,也称公共因子,是事物的基本特征或本质因子,是不可直接观测的潜在变量。。它们的系数称为因子载荷,它表示第个应试人员在六因子方面的能力。是第个应试人员的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定:。 公共因素,也称公共因子,是事物的基本特征或本质因子,是不可直接观测的潜在变量。 因子分析的任务,首先估计出和方差,然后将这些抽象因子赋予实际背景的解释或予以命名。因子分析有两种类型:R型,对变量作因子分析;Q型,对样品作因子分析。 基本思想 因子分析的思想是通过变量(或样品)的相关系数矩阵(相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间相关(相似)关系。这样因子分析一方面可简化观测系统,简化原始变量结构,再现变量之间的内在联系,达到降维的目的;另一方面可对原始变量进行分类,把相关性较高,即联系比较紧密的变量归为同一类,而不同类的变量之间的相关性较低。 §2 因子分析的数学模型 实际工作中,我们所掌握的只是搜集到的样本数据资料,例如学生的各科成绩,企业的各项指标等。所以这里我们帖变量出发,通过变量模型,即总体因子分析模型引伸出样本因子分析模型。 因子模型(正交因子模型) 1.总体因子模型 R型因子分析和Q型因子的计算过程完全相同,只不过出发点不同:R型是从相关系数矩阵出发;Q型是从相似系数矩阵出发。 用矩阵表示: 简记为: 或 满足条件: ①; ②; ③,,即不相关

文档评论(0)

1亿VIP精品文档

相关文档