1、SPSS数据的预处理重点.ppt

  1. 1、本文档共126页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
快速样本聚类分析 根据被观测的对象的各种特征,即反映被观测对象的特征的各变量进行分类。当要聚成的类数已知时,使用快速聚类过程可以很快将观测量分到各类中去,其特点是处理速度快,占用计算机内存少。 1.1 根据下表12个地区城市建设指数(用来反映城市风貌的一些指数)。请采用快速样本聚类的方法将这些地区的城市风貌归为8类。(此数据为虚构,仅供演示方法用) X1 X2 X3 X4 X5 X6 X7 X8 地区 人口指数 绿化指数 建设指数 信息指数 文化指数 交通指数 收入指数 流通指数 a 110.2 59.76 8.38 4.49 26.8 16.44 1.99 0.41 b 82.58 50.98 13.4 9.33 21.3 12.36 9.21 1.05 c 83.33 53.39 11 7.52 17.3 11.79 12 0.7 d 71.72 47.72 9.42 6.96 13.12 7.9 6.66 0.61 e 68.91 43.41 22.4 15.3 13.88 12.42 9.01 1.41 f 107.8 62.24 15.6 8.88 31 21.01 11.8 0.16 g 73.18 44.54 23.9 15.2 22.38 9.66 13.9 1.19 h 72.23 47.31 9.48 6.43 13.14 10.43 8.3 1.11 i 84.66 44.05 13.5 7.47 19.11 20.49 10.3 1.76 j 114 41.44 33.2 11.2 48.72 30.77 14.9 11.1 k 74.96 50.13 13.9 9.62 16.14 10.18 14.5 1.21 l 5.6 50.88 5.21 3.89 12.94 9.49 6.77 1.27 从聚类结果可知,地区a为一类;地区b、c、k为一类;地区d、h为一类;地区e和g为一类;地区f为一类;地区j为一类;地区l为一类 系统聚类(分层聚类分析) 由于人们对客观事物的认识是有限的,往往难以找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研究。因此往往先要进行变量聚类,找出彼此独立且有代表性的自变量,而又不丢失大量信息。 (对变量聚类R; 对样本聚类Q) 分层聚类分析(系统聚类) 对变量聚类---R型 分层聚类分析(系统聚类) 对样本聚类---Q型 (1)选择菜单分析-对个案内的值计数,出现如下窗口: 1.4.3 计数的基本操作 (2)将参与计数的变量选到 变量框中 (3)在目标变量框中输入存放计数结果的变量名,并在目标标签框中输入相应的变量名标签。 (4)单击定义值按钮定义计数区间,出现如下图窗口: 通过单击添加、更改、删除按钮完成计数区间的增加、修改和删除。 (5)如果仅希望对满足某条件的个案进行计数,则单击If按钮并输入相应的SPSS条件表达式。否则,本步可略去。 1.5 分类汇总 1.5.1 分类汇总的目的 分类汇总是按照某分类变量进行分类汇总计算。 例如:某企业希望了解本企业不同学历职工的基本工资上是否存在较大差距。最简单的做法就是分类汇总,即将职工按学历进行分类,分别计算不同学历职工的平均工资,然后可对平均工资进行比较。 再例如,某商厦希望分析假日周内不同职业和不同年龄段的顾客对某商品的“打折促销”反应是否存在较大差异,用以分析不同消费群体的消费心理。最初步的分析可以是分别计算不同职业中不同年龄段顾客的平均消费金额和平均消费金额差异程度(标准差),并对它们进行比较。这个过程也可以通过分类汇总过程完成。 SPSS实现分类汇总涉及两个主要方面: 按照哪个变量(如上例中的学历、职业和年龄段)进行分类 对哪个变量(如上例中的基本工资、消费金额)进行汇总,并指定对汇总变量计算哪些统计量(如上例中的平均工资、平均消费金额和标准差) (1)选择菜单数据-分类汇总,出现如下所示的窗口: 1.5.2 分类汇总的基本操作 (2)将分类变量选到分类变量框中 (3)将汇总变量选到汇总变量框中 (4)单击函数按钮,指定对汇总变量计算哪些统计量。SPSS默认计算均值。 (5)指定将分类汇总结果保存到何处。有三种选择: 第一,将结果存放到当前数据编辑窗口中。 第二,将结果存放到系统默认的名为aggr.sav的SPSS数据文件中,可以单击File按钮,重新指定文件名; 第三,用分类汇总结果覆盖数据编辑窗口中的数据。 一般选择第二种方式,结果比较清晰。 (6)单击变量名与标签按钮,重新指定结果文件中的变量名或添加变量名

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档