SPSS数据的预处理.pptVIP

下载本文档

2
0
约2.12千字
约 34页
2019-07-11 发布于安徽
举报
版权申诉

SPSS数据的预处理.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据拆分－算例 1.数据“用户评价”是某一年全球通、动感地带、神州行、大众卡对中国移动的服务评价，试根据用户类型对数据进行拆分，比较各用户类型的评价平均分。小结本章主要阐述了数据管理的基本内容，包括变量的计算、分组合并、排序以及数据的合并等等。数据良好的加工整理是数据分析的重要基础。 Thank you! 谢谢！放映结束感谢各位的批评指导！让我们共同进步 SPSS统计分析方法 Part 1：第三章数据预处理 1.变量级别的数据管理 2.文件级别的数据管理(一) 3.文件级别的数据管理(二) 学习要求掌握变量计算、分组合并等变量级别的数据管理方法学习要求掌握记录排序、数据汇总、数据合并等文件级别的数据管理方法数据预处理的主要内容编秩汇总分组连接 … 计算拆分排序数据预处理 3.3变量计算对数据的转换处理针对每个个案，都有自己的结果算述表达式：由常量、变量、算数运算符、圆括号和函数组成的式子。工资*0.1 Mean(数学，语文，英语)-60 3.3 变量计算条件表达式：由关系运算符、逻辑运算符、变量、常量、算术表达式等组成；其结果为真（1）或者假（0）关系运算符：逻辑运算符：与（且）；或|；非~ （nl=35）and not (zc3) 优先级 3.3 变量计算——P51 函数：可以看做是功能体；我们告诉已知，函数给出结果 Mean函数：功能计算平均数 Mean（语文，数学，英语）常见函数算数函数统计函数：均值（mean），标准差(Sd)，方差(Variance) 与分布相关的函数查找函数字符函数日期函数缺失值函数其他函数 3.3 变量计算根据用户的要求，在原变量的基础上，计算一个新的结果，并生成一个新的结果变量。变量的计算在转换Transform →计算变量Compute 中实现：存放结果的变量名条件函数库变量计算主对话框变量计算－算例数据“厨师的得分表”是15名厨师参加某一次厨艺大赛的成绩，比赛共分3个环节。 1.求每个厨师3个环节的加权总分，3个环节的权重分别为0.3、0.5、0.2； 2.求第一环节分数在80分以上的厨师平均得分。 3.5 计数计算若干变量中有几个变量的值落入了指定区间内，并将结果存入一个新的变量中。学号语文数学英语体育 001 89 66 85 90 .。。 3.5 计数——统计不及格课程数目数据计数.sav 【转换T】?【对个案内的值计数O】目标变量名目标变量名标签参与计数的变量定义计数区间 [60,90) ( ,60) [90, ) 离散值 3.6 分组合并对同一变量的变量值按照某种分组，并合并。变量的分组合并在转换 →重编码为相同（不同）变量中实现，相同变量表示在原始变量基础上修改，不同变量表示生成一个新变量来表示分组情况分组合并主对话框新变量设置选择需要分组合并的变量新变量设置对话框新变量设置旧变量的分组范围数据分组合并－算例 1.在数据“概率论成绩”中生成新变量“评价”，当成绩小于60分时为“不合格”， 60～70分之间时为“合格”， 70～80分时为“中等”， 80～90分时为“良好”， 90分以上时为“优秀”。 3.1 排序变量的排序是指根据变量值的大小按升序或降序进行排列，在数据 →排序个案/变量中实现选择需要排序的变量升序降序变量排序主对话框 3.4 数据选取数据选取指从大批量（总体）数据中按照一定规则选取部分数据（样本）参与分析，在数据 →选择个案中实现选取方法：（1）按指定条件选取 If condition is satisfied （2）随机选取 Random sample of cases （3）选取某一区域内的样本 Based on time or case range 适用于时间序列数据（4）通过过滤变量选取 Use filter variable 要求指定一个变量作为过滤变量，变量值为非0或非系统缺失值的个案将被选中，常用于排除包含系统缺失值的个案。按指定条件选取随机选取选取某一区域作为样本通过过滤变量选取筛掉未选中的个案将选中的个案拷贝到一个新的数据文件删除未选中的个案精确选取选取？个；从前？个个案中选取随机近似百分比数值从所有个案中选取？%的数量 3.6 分类汇总分类汇总是按某分类变量进行分类计算，在数据 →分类汇总中实现按照那个变量分类对哪个变量进行汇总，并指定汇总出哪些统计量按照性别对数学成绩进行汇总计算平均成绩即：分别计算出男生们的数学平均成绩和女生们的数学平均成绩分类变量汇总变量汇总结果加到当前数据