SPSS第12章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS第12章

1.3 例子 例9.1在某次儿童生长发育调查中测量了许多指标,其中有关心脏的指标为心脏横径、纵径、宽径、胸腔横径以及心脏面积,数据见heart.sav。因这五个指标存在较强的相关性,请从中提取适当数量的主成分,以替代原变量用来进行以后的分析。 解:显然这五个指标都是反映心脏大小的指标,数值上的相关性是不言而喻的,分析中直接纳入可能会造成严重的共线性问题。此处需要采用主成分分析提取出主要信息。并不十分明确需要提取多少个主成分,因此暂时按照特征根大于l的默认准则进行筛选,最后看提取信息量的充分与否来确定是否需要引入更多主成分。 分析结果 Correlation matrix KMO and Bartlett’s Test Communalities Total variance explained Scree plot Component Matrix Component Score coefficient Matrix Component Score covariance Matrix 对引例的进一步分析 加入第二个公因子 主成分图 正交旋转 第12章 因子分析与对应分析 Data Reduction Factor Analysis过程;提供因子分析/主成分分析方法,它们是最为常用的数据简化方法,用于考察多个定量变量间的内在结构,或者提取数据的主要信息。 Correspondence Analysis过程:进行简单对应分析,该方法同样以数据简化的原则力图直观的给出各两个分类变量各个类别之间的联系,当各个变量的类别越多时,该方法的优势就越明显。 Optimal scaling过程:进行最优尺度分析,该方法的核心目的也是力图在低维度空间表述两个或多个变量之间的内在联系。所分析的变量以分类变量为主,但也可以为连续性变量。该方法实际上包括,但不仅仅限于对应分析方法。 1 Factor Analysis过程 Factor Analysis过程进行的是因子分析。该分析方法最早由心理学家发展起来,目的是借助提取出的公因子来代表不同的性格特征和行为取向,从而解释人类的行为和能力。 和因子分析方法非常近似的还有主成分分析方法,两者的主要区别是应用目的不同,在拟合过程上则区别不大(因子分析中最常用的因子提取法就是主成分法)。 因子分析在某种程度上可以被看作是主成分分析的一种推广,虽然两者都是逼近协方差阵,但因子分析模型在解释上要更精确些。 1.1 模型简介 【主成分分析】 主成分分析只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且可能因多元共线性而无法得出正确结论。主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,从而在不丢掉主要信息的前提下避开了变量间共线性的问题,便于进一步分析。 主成分分析不能被看成是研究的结果,而应继续采用其他多元统计方法以解决实际问题。 在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合,比如有两个原始变量x1和x2,则一共可提取出两个主成分如下: z1=bl1xl+b21x2 z2=b12xl+b22x2 原则上如果有n个变量,则最多可以提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前2~3个主成分已包含了90%以上的信息,其他的可以忽略不计。 提取出的主成分能包含主要信息即可,不一定非要有准确的实际含义。 【因子分析】 因子分析也是一种将多变量化简的技术,它可以被看成是主成分分析的推广,因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则较低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。 因子分析一般要求提取出的公因子有实际含义,如果分析中各因子难以找到合适的意义,则可以通过适当的旋转,改变信息量在不同因子上的分布,最终方便对结果的解释 比如在市场调查中收集了食品的五项指标:味道、价格、风味、是否快餐食品、能量。经过因子分析后发现结果如下: x1=0.02z1+0 99z2+ε1 x2=0.94zl-0.01z2+ε2 x3=0.13z1+0.98z2+ε3 x4=0.84zl+0.42z2+ε4 x5=0.97zl-0.02z2+ε5 x1-x5为原始变量,z1~z5则为公因子。上式表明第一公因子主要影响价格、是否快餐食品和能量,第二公因子则主要影响味道和风味。结合实际,前一公因子代表“价廉”,后一公因子代表“味美”。式中的ε代表特殊因子(注意并非普通意义上的残差),它只对当前变量有影响,表示该变量中独特的,不能

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档