第3章SPSS数据的预处理.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 SPSS 数据的预处理 1 第三章 SPSS 数据的预处理 数据的排序 查找重复个案 变量计算 数据选取(抽样) (变量值)计数 分类汇总 数据分组(变量重新赋值) 数据预处理的其它功能:转置、加权、数据拆分、缺失值处理等 菜单选项: “数据”、“转换” 2 数据的排序 数据的排序:将所有个案按照用户指定的某一个或多个变量的变量值进行升序或降序重新排列。 排序的作用:方便了解数据的取值分布状况,特别是有助于发现数据的异常值。 注意: (1) 排序的次序:升序、降序。 (2) 多重排序时,指定排序变量的次序很关键。 (3) 数据排序是对个案排序,而不只是对变量排序。 3 数据的排序 菜单选项: 数据 - 排序个案 例:“职工数据.sav” 主排序变量:职称-降序, 第二排序变量:基本工资-升序, 第三排序变量:年龄-升序 4 查找重复个案 重复个案:关键变量相同的个案 查找重复个案的方法:先按指定的关键变量对所有个案排序,再确定重复个案中哪个个案是应保留下来的。 菜单选项: 数据 - 标识重复个案 例:“职工数据_纵向合并.sav” 5 变量计算 含义:根据用户给出的 SPSS 算术表达式及函数,对所有或部分满足条件的个案进行加工。 目的:产生新变量或对原变量进行必要的转换 注意:(1) 变量计算是针对个案的,每个个案都有相应的计算结果;(2) 变量计算的结果应保存到一个指定变量中。 三个概念:SPSS算术表达式、SPSS条件表达式和SPSS函数。 6 SPSS 算术表达式 SPSS算术表达式是由常量、变量、算术运算符、圆括号、函数等组成的式子。 字符串型常量应当用引号括起来; 变量是指那些已存在于数据编辑窗口中的变量; 算术运算符主要包括+、-、*、/、**(乘方); 在同一算术表达式中的常量及变量,数据类型应该一致,否则无法计算 。 7 SPSS 条件表达式 条件表达式通常用于指定满足某个条件的个案。 条件表达式是一个对条件进行判断的式子。其结果有两种取值: 如果判断条件成立,则结果为真; 如果判断条件不成立,则结果为假。 条件表达式包括简单条件表达式和复合条件表达式。 8 SPSS 条件表达式 简单条件表达式: 由关系运算符、常量、变量以及算术表达式等组成的式子。 关系运算符包括: 、、=、~=(不等于)、=、=。 如:nl 32、sr = 900 复合条件表达式: 由逻辑运算符号、圆括号和简单条件表达式等组成的式子。 逻辑运算符号包括 ~ 或 NOT(非)、 或 AND(并且)、| 或 OR(或者)。 如:(nl32) and not (sr=900) 9 SPSS 函数 算术函数:完成特定的算术计算。 统计函数:计算基本的描述统计量。 与分布有关的函数:随机函数,分布函数及其反函数、概率密度函数等。 查找函数:用于查找判断。 字符串函数:对字符型数据进行处理。 日期函数:对日期进行处理。 缺失值函数:用于判断缺失值。 其他函数:一些辅助函数。 10 变量计算 菜单选项: 转换 - 计算变量 例1:“大学生职业生涯规划.sav” 问题:对每个个案计算 Q61 ~ Q64 的总得分,称为对专业和职业的认知得分。 例2:生成 10 个服从 N(0,1) 分布的随机变量 11 数据选取 数据选取:根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。 目的: (1)提高数据分析效率;(2)可选取部分数据参与建模,剩余的数据用于检验模型。 菜单选项: 数据 - 选择个案 12 数据选取 方法: 按指定条件选取:只选取符合条件的数据 随机选取:抽样 选取某一范围内的样本:用于时间序列数据 使用筛选器变量:选定一个变量,取值为非0或非系统缺失值的个案被选中,用于排除包含系统缺失值的个案 注意:应根据不同的分析要求采用不同的选取方法 13 数据选取 例:“大学生职业生涯规划.sav” 问题: (1) 仅对大四学生进行分析; (2)随机选取100个个案。 注意:完成数据选取后,之后的分析将只针对被选中的个案。 取消个案选取的方法: 删除 SPSS 产生的中间变量 “filter_$” 在选择个案窗口中选择“全部个案” 14 计数 计数:对所有个案或满足某条件的部分个案,计算其若干变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新变量中的过程。 例如,对大学毕业班学生的成绩进行综合测评时,可以依次计算每个学生的若干门课程中有几门课程为优,有几门课程为良,有几门课程不及格。 步骤:指定参与计数的变量、指定计数区间 菜单选项: 转换 - 对个案内的值

文档评论(0)

586334000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档