多远统计分析--因子分析.pptVIP

  • 6
  • 0
  • 约2.08千字
  • 约 40页
  • 2018-01-26 发布于河北
  • 举报
多远统计分析--因子分析

多元统计分析分析—— 因子分析 通常先对x作标准化处理,使其均值为零,方差为1. * 相关例子 奥林匹克十项全能:百米跑、跳远、铅球、跳高、400米跑、百米跨栏、铁饼、撑杆跳远、标枪、1500米跑 研究问题:十项全能所包括的运动技能可概括为几项?十项全能可压缩为哪几个项目? 实验设计:记录了34名运动员1988年奥赛的成绩 数据文件及变量:Olymp88.sav 田赛成绩6项(长度m) 径赛成绩4项(秒sec) 统计分析问题:10个原始变量是否可用少量因子表示?与这些因子相关性最强的原始变量是什么? * 因子分析的基本思想 因子分析是根据相关矩阵内部的依赖关系,把一些具有错综复杂关系的变量综合为数量较少的几个因子。通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。 简单地说,就是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为因子。 * 例如 某公司与48名申请工作的人进行面谈,然后就申请人十五个方面进行打分,这十五个方面分别是:申请书的形式、外貌、学术能力、讨人喜欢的能力、自信心、洞察力、诚实、推销能力、经验、工作积极性、抱负、理解能力、潜力、入围公司的强烈程度、适应性。这15个方面可归结为应聘者的外露能力、讨人喜欢的能力、经验、专业能力这4个方面。 * 因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。 例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。 * 但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为: 称 是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子。 * 因子分析模型 一、数学模型 设 个变量,如果表示为 * 称为 公共因子,是不可观测的变量,他们的系数称为因子载荷。 是特殊因子,是不能被前m个公共因子包含的部分。并且满足: 即不相关;即 通常先对x作标准化处理,使其均值为零,方差为1. * 即 互不相关,方差为1。 即互不相关,方差不一定相等, 。 * 用矩阵的表达方式 * 1、因子载荷 aij 的统计意义 因子载荷 是第i个变量与第j个公共因子的相关系数 模型为 (载荷矩阵中第i行,第j列的元素)反映了第i个变量与第j个公共因子的相关性。绝对值越大,相关的密切程度越高。 根据公共因子的模型性质,有 三、 因子载荷矩阵中的几个统计特征 * 2、因子载荷不是惟一的 且满足因子模型的条件 设T为一个 p×p 的正交矩阵,令A*=AT, ,则模型可以表示为 公因子方差(Communality) 观察变量方差由两部分组成:一部分是由公因子决定,另一部分是由特殊因子决定。 反映了m个公因子在xi 的方差中所占比例.公因子方差越大(接近1),变量能被公因子说明的程度越高,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好 公因子方差(共性方差): 公因子的方差贡献(Contributions) 每个公因子对数据的解释能力,可以用该因子所解释的总方差来衡量,通常称为该因子的贡献,记为gj 它等于和该因子有关的因子负载的平方和 fj 的方差贡献: fj 的方差贡献率: 因子模型参数估计-主成分法 xi关于主成分y1,y2,…,ym的回归方程 中下标的含义:i →原指标序号 j →主成分序号 因子模型 公因子方差(共性方差): fj 的方差贡献: 因子得分 主成分取值: 因子得分: 因子得分系数矩阵: 利用主成分法进行因子分析的步骤 1、求出原指标xi 的相关系数矩阵R 2、求出相关系数矩阵R的特征根 和其对应的单位化特征向量 3、根据累计贡献率 确定m个主成分(公因子),等价于确定m个p维向量 4、求出原指标xi 与第 j 个主成分(公因

文档评论(0)

1亿VIP精品文档

相关文档