统计与方法-第八章主成分与因子学案.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
公因子方差表 提取出来的公因子对每个变量的解释程度到底有多大呢?可从公因子方差表得知: (0.744+0.736+0.718+0.890+0.870+0.880)/6=0.8113 因子旋转 为了对公因子F能够更好的解释,可通过因子旋转的方法得到一个好解释的公因子。 所谓对公因子更好解释,就是使每个变量仅再一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。 这种变换因子载荷的方法称为因子轴的旋转。因子旋转的方法很多,常用的为方差最大正交旋转。 这里,第一个因子主要和语文、历史、英语科有很强的正相关;而第二个因子主要和数学、物理、化学三科有很强的正相关。因此可以给第一个因子起名为“文科因子”,而给第二个因子起名为“理科因子”。从这个例子可以看出,因子分析的结果比主成分分析解释性更强。 这些系数所形成的散点图(在SPSS中也称载荷图),可以直观看出每个因子代表了一类学科 。 因子得分 在分析中,人们往往更愿意用公共因子反映原始变量,这样根有利于描述研究对象的特征。因而往往将公共因子表示为变量(或样品)的线性组合,即: 称上式为因子得分函数,用它可计算每个样品的公因子得分。估计因子得分的方法很多。 可以根据输出,计算出每个学生的第一个因子和第二个因子的大小,即算出每个学生的因子得分f1和f2。 人们可以根据这两个函数分别计算出每个学生的两套因子得分,对学生分别按照文科和理科排序。 也可以每个因子的方差贡献率为权数,进行加权综合,计算出每个学生的总得分,以此排队。 主成分和因子分析的一些注意事项 可以看出,因子分析和主成分分析都依赖于原始变量,也只能反映原始变量的信息。所以原始变量的选择很重要。 另外,如果原始变量都本质上独立,那么降维就可能失败,这是因为很难把很多独立变量用少数综合的变量概括。数据越相关,降维效果就越好。 * * 因子分析的判断 KMO测度和巴特利特球体检验: KMO值:0.9以上非常好;0.8以上好;0.7一般;0.6差;0.5很差;0.5以下不能接受。 巴特利特球体检验的 H0:相关矩阵为单位阵 主成分和因子分析的一些注意事项 在得到分析的结果时,并不一定会都得到如我们例子那样清楚的结果。这与问题的性质,选取的原始变量以及数据的质量等都有关系 在用因子得分进行排序时要特别小心,特别是对于敏感问题。由于原始变量不同,因子的选取不同,排序可以很不一样。 Spss实现 Spss选项:Analyze-Data Reduction-Factor 用Extraction,选择提取共因子的方法(如果是主成分分析,则选Principal Components), 用Rotation,选择因子旋转方法(如果是主成分分析就选None), 用Scores计算因子得分,再选择Save as variables(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如Regression);要想输出Component Score Coefficient Matrix表,就要选择Display factor score coefficient matrix; 因子分析—例11.1 仍以学生成绩的数据(student.sav)为例,说明因子分析的过程。 * 因子分析—例11.1 北京市各区县的社会经济发展水平存在着一定的差异,然而反映社会经济发展水平的指标很多,如何反映各区县之间的差异,进行多指标的综合评价是统计分析的问题之一。因为指标较多且之间的相关性很强,用主成分分析和因子分析可以用较少的综合指标,反映原来变量的较多的信息,达到降维简化分析过程的目的。 数据文件:北京市各区县主要指标因子分析.sav。数据来源:北京统计年鉴 2004 * 因子分析—例11.1 变量名称: x1-在岗职工平均工资(元/人) x2-地区生产总值(万元) x3-城镇居民人均可支配收入(元) x4-地方财政收入(万元) x5-全社会固定资产投资(万元) x6-社会消费品零售额(万元) x7-从业人数。 * 各指标的相关系数矩阵 * * 碎石图 * 因子载荷矩阵 * 因子旋转 * 因子得分 * 因子得分 * 因子得分 由因子得分系数,我们可以得到计算因子得分的线性方程: f1=-0.212x1+0.307x2-0.384x3+0.183x4+0.367x5+0.233x6+0.263x7 f2=0.573x1-0.163x2+0.799x3+0.025x4-0.265x5-0.052x6-0.095x7 主成分分析和因子分析 主成分与因子分析 * 主成分与因子分析 好裁缝做上衣,要测量上体长、手臂长、胸围等 14 个指标。用流水线生产上衣时要测量每个顾客的 14 个指标是不可能的。 于是统计学家出了个主意:这

文档评论(0)

yy558933 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档