数据分析入门培训课件spss教学.pdf

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第SPSS章 主成分分析、因子分析 分类模型(聚类分析) 判别分析 方差分析 (进阶) 对应分析 信息浓缩技术 --主成分分析、因子分析 主成分分析、因子分析 概述 •解决变量间多重共线性(data reduction) ◼ 有太多的变量,希望能够消减变量,用一个新的、更小 的由原始变量集组合成的新变量集作进一步分析 ◼ 新变量集能够更有利于简化和解释问题 •探讨变量内在联系和结构(structure detection) ◼ 观测变量之间的存在相互依赖关系 ◼ 由量表所反映出的受访者对卫生服务的真实满意度 3 主成分分析 •只是一种中间 ,其背景是研究中经常会遇到多 指标的问题,这些指标间往往存在一定的相关,直 接纳入分析不仅复杂,变量间难以取舍,而且可能 因多元共线性而无法得出正确结论 •主成分分析的目的就是通过线性变换,将原来的多 个指标组合成相互独立的少数几个能充分反映总体 信息的指标,便于进一步分析 ◼ 尽可能保留原始变量的信息,且彼此不相关 4 x2 x2 Y1 Y2 x1 x1 X1与x2相关 Y1与Y2不相关 5 •在主成分分析中,提取出的每个主成分都是原来多 个指标的线性组合 • 两个原始变量x1和x2 ,则一共可提取出两个 主成分如下: ◼ z1=b11x1+b21x2 ◼ z2=b12x1+b22x2 6 •原则上如果有n个变量,则最多可以提取出n个主 成分,但如果将它们全部提取出来就失去了该方法 简化数据的实际意义。多数情况下提取出前2~3个 主成分已包含了90%以上的信息,其他的可以忽 略不计。 •在进行主成分回归时,提取出的主成分能包含主要 信息即可,不一定非要有准确的实际含义。 7 主成分分析 •方法用途 ◼ 主成分评价:当进行多指标的综合评价时,应用主成分 方法将多指标中的信息集中为若干个主成分,然后 求和,得到综合评价指数。 ◼ 主成分回归:通过对存在共线性的自变量进行主成分分 析,从而在提取多数信息的同时解决共线性问题。 8 案例: 经济发展情况综合评价 •现希望根据 30个省市 经济发展基本情 况的八项指标对其进行分析和排序。具体指标有: GDP、居民消费水平、固定资产投资、职工平均 工资、货物周转量、居民消费价格指数、商品零售 价格指数、工业总产值,数据文件见 factor1.sav。 9 因子分析 •是一种多变量化简技术。目的是分解原始变量,从 中归纳出潜在的“类别”,相关性较强的指标归为一 类,不同类间变量的相关性较低。每一类变量代表 了一个“共同因子”,即一种内在结构,因子分析就 是要寻找该结构。 ◼ 探索性因子分析 ◼ 证实性因子分析 10 •比如在市场 中收集了食品的五项指标:味道、 价格、风味、是否快餐食品、能量。经过因子分析 后发现结果如下: ◼ x1=0.02z1+0.99z2+ε1

文档评论(0)

187****4471 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档