第三章--spss-数据的预处理(1).pptVIP

下载本文档

7
0
约1.08万字
约 47页
2019-07-15 发布于江苏
举报
版权申诉

第三章--spss-数据的预处理(1).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * 5 分类汇总根据高考总分，分析学生智力水平是否和性别有关，即按性别计算出高考总分的平均值、最高分和最低分。这两个例子的计算有如下特点：需要对数据进行分类，计算出每一类的某一经济指标。用SPSS如何实现呢？ A) 按照哪个变量进行分类(如：区域、性别)。 B) 对哪个变量进行汇总(如：职工工资、高考总分)。 C) 计算哪些指标(如：平均值、最大值和最小值)。经济工作者根据工资数据，研究各县市职工的生活水平差异，需要计算各县市工资的平均工资。 1) 分类汇总关注的问题 * * 2) 分类汇总的基本操作 A) 打开汇总菜单点击：Data ? Aggregate(总计、汇总)，弹出分类汇总对话框。 B) 选择分类变量从左边的变量列表框选择分类变量到Break(破裂) Variable框中。操作：职业。 C) 选择汇总变量汇总变量Aggregate Variable模块。例：利用居民储蓄调查数据.sav数据集，分析职业与存款数额之间的关系。 * * 操作：存款金额 D) 确定计算什么统计量。点击【 Function 】按钮，弹出选择对话框，可供选择的统计量包括：均值、求和、最大值、最小值等20个选项，默认选项是均值，每次只能计算一个统计量。默认是均值。【 NameLable 】按钮为计算的统计量定制标签。操作：均值(注意观察汇总变量的取值随着选择的改变而改变) E) 输出每一类中包含的个案数。选择框 Number of cases，若选择将生成一个每一类中所含个案数的变量，变量名为N_BREAK。 * * E) 指定计算的统计量保存到何处。有3中选择。 a) Add aggregated variables to active dataset。将统计量的计算结果存储到当前数据集。 b) Create a new dataset containing only the aggregated variables 。创建一个只含指定统计量作为变量的新数据集。这时需在下面的文本框给出数据集的名字。 c) Write a new data file containing only the aggregated variables。将计算的统计量存储到一个默认名称为agg.sav，的新文件中。文件类型可以不是SPSS的文件类型。 F) Options for very large datasets 大数据集选项。 a) File is already sorted break variable 在计算分类统计量之前已经关于分类变量排序。 * * G) 多重分类汇总分类变量可以多于一个，这时的汇总称为多重分类汇总。第一个分类变量称为主分类变量。分类变量的指定顺序决定了汇总的先后顺序。例如，主分类变量是职业，第二分类变量为年龄。略。引子：统计分析，经常要将数据进行分组，研究一类数据的共性。对于各种各样的数据，如何用SPSS实现分组呢？ b) Sort file before aggregating 在执行分类汇总前，系统先执行关于分类变量排序。通过分类统计可以看出，随着职业的不同，存款数量的平均值也不同。查看数据集。 * * 6 数据分组数据分组是根据统计研究的需要，按照一定的特征将总体区分为若干个性质不同而又存在联系的部分的一种方法。这些部分称为这一统计总体的组。数据分组对总体而言是“分”，即把总体划分为性质相异的若干组；对个体而言是 “合”，即把性质相同的个体合为一组。 1) 数据分组的意义 (1) 为什么要数据分组 (2) 数据分组的原则 * * 另一方面，差异很大时的两个事物看成相同的类，将抹杀事物质的区别与特征，混淆事物的优劣，不能正确的评价出事物的好坏将不利于相关工作的开展。 (3) 分类原则的总结一次性存款数量为1000元与1020元，虽然数量存在差异，未必有什么质的差别。考试成绩84分与88分的学生，虽然分数不同，但学生的基本素质可能没有本质的差别。统计分组的原则，是保证组间各个单位具有差异性，组内的各个单位具有同质性。 * * 2) 组距分组(重赋值 Recode) 对于定距变量，由于数值型变量的连续性与稠密性，为了研究的需要，有时需将数据进行分组。分组既要体现出组之间的差异，又不能分组太多，需要确定合适的分组区间。将变量的变化范围依次分成若干个满足包容性和互斥性的数值区间。什么叫包容性与互斥性呢？ (1) 组距分组的定义用文字表示的品质变量，如性别、职称、民族等等，这样的变量相当于利用变量的不同取值，自然的进行了分组。 * * 按照组距分组的定义，用组的区间作为组的名称直观，但如果组区间数值很大或很复杂，研究问题不是很方便。将各个区间重新赋予一个值作为组的名