网站大量收购独家精品文档,联系QQ:2885784924

主成分与因子教案.ppt

  1. 1、本文档共107页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计分析方法 主成分分析 与 因子分析 第一部分 主成分分析 我们经常遇到有很多变量的数据。 在如此多的变量之中,有很多是相关的。 人们希望能够找出它们的少数“代表”(综合指标)来对它们进行描述。 下面介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。 主成分法的基本思想 考虑二维情形,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值; 这些数据大致分布于一个椭圆形的区域中,如下图所示: 这个椭圆有一个长轴和一个短轴。 在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。 如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。 椭圆(球)的长短轴相差得越大,降维效果越好。 主成分法的数学模型 实际使用过程中,先将变量标准化 运用拉格朗日乘子法求约束条件下的极值: 令 得: 结论(以y1为例) 原变量相关系数矩阵的最大特征值即为y1的方差, 第二部分 因子分析 一、因子分析的作用 因子分析的作用主要有两个: 1.数据简化 可为进一步应用其他统计方法(如相关分析、回归方法、判别分析法等)提供便利条件。 2.寻求变量的基本结构 二、因子分析的基本步骤 1.计算所有变量的相关矩阵,根据计算结果判断应用因子分析方法是否合适。如果各变量独立性较强,则不适合。 2.提取因子。该步要确定求因子解的方法,和提取因子的个数。 3.进行因子旋转,对旋转后的新因子作出实际意义解释。 4.计算因子值。即每个Case的各因子值(称为因子得分值) 三、因子分析法的基本操作 Analyze →Data Reduction →Factor… 打开Factor Analysis对话框 将参与因子分析的变量依次选入Variables框中 分别对“Extraction”, “Rotation”, “Scores” 等项进行设置. 单击“OK”即可 “Extraction”对话框选项 Method: Principal components (主成分分析,系统默认) Unweighted least square (普通最小二乘法) Generalized least squares (广义最小二乘法) Maximum likelihood (最大似然法) Principal Axis factoring (主轴因子法) Alpha (α因子提取法) Image (映像分析法) Extract:决定提取因子的个数 Eigenvalue over: 指定要提取因子的最小特征值,系统默认值为1 Number of factors:直接指定提取的因子个数。 Display:指定与初始因子有关的输出项 Unrotated factor solution:显示未旋转的因子解 Scree plot:显示碎石图,用于决定因子提取个数。 “Rotation”对话框选项 Method:选择因子旋转方法 None(不进行旋转) Varimax (方差最大法) Equamax (等量最大法) Quartimax (四次方最大法) Direct Oblimin (斜交旋转) Display:指定输出选项 Rotated solution:显示旋转后的因子解 Loading plots:显示因子载荷图 “Scores”对话框选项 Method:指定计算因子值方法 Regression:回归法 Bartlett:巴特利特法 Anderson-Rubin:安德森—鲁宾法 Save as variables:将因子值作为新变量保存在数据文件中。 例1 对公司业绩评价,选取了11个指标。 (详见“因子分析”数据文件) 本例目的: 将11个指标进行简化综合 判断“是否适合作因子分析” 请进行以下操作…………. 输出“碎石图” 请作以下操作……….. 进行因子旋转(一般都需要) 否则所得因子无法命名(缺乏实际经济意义) 操作………. 计算因子得分 操作………….. 要求因子载荷系数按大小顺序排列 操作………. 输出结果:相关系数矩阵 用于判断是否作因子分析 如果存在大量的接近零的相关系数,则不适合作因子分析。 KMO指标大于0.7时,适合作因子分析。 0.6以上,作因子分析还可以 0.6以上

文档评论(0)

三沙市的姑娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档