第三章 SPSS数据预处理).pptVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 SPSS数据的预处理 3.1数据的排序 首先在数据窗中建立或读入一个数据文件(职工数据.sav)。 按Data ? Sort Cases,弹出一个排序对话框(以职称为主排序变量降序,基本工资为第二排序变量的升序进行多重排序)。 依据需要进行选择,然后单击OK按纽即可。 3.1变量计算 目的:产生新变量或对原变量进行必要的转换处理 (1)含义: 根据用户给出的SPSS算术表达式,对所有或部分样本数据进行加工。 (2)菜单选项: transform-compute if 按钮 (3)SPSS算术表达式(Numeric Expression): 由算术运算符(+ 、-、 *、 /、 **)、SPSS函数以及SPSS变量名组成的式子。 变量转换 算术函数 统计函数 分布函数 逻辑函数 字符串函数 缺失值函数 日期时间函数 其他函数 Abs() sqrt() rnd() trunc() mod() mean() sd() sum() cfvar() max() min() normal() uniform() rv.() cdf.() idf.() range() any() index() length() lower() lpad() ltrim() substr() missing() sysmis() 变量转换 (5)SPSS条件表达式: 条件表达式:由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。 关系运算符: (大于)、 (小于)、 =(等于)、 ~=(不等于)、 =(大于等于)、 =(小于等于) 如:nl32、sr=700 应用举例: 打开职工数据.sav,依据职称级别计算实发工资,计算规则是:实发工资等于基本工资减去实业保险,然后,依据职称1~4等级分别将以上计算结果上浮5%,3%,2%,1%。 3.3数据选取 目的: 从现有数据中挑选出部分数据。 菜单选项: data - select cases 选取个案的几种不同方式 (1)选择符合一定条件的个案(If condition is satisfied) (2)随机选取个案(Random sample of cases) 近似选取、 (3)选取某一区域内的个案(Based on time or case range) (4)使用过滤变量(use filter variable) 注意:以后的操作和分析都在该个案选取的基础上进行. 举例: 住房状况调查数据,分别按照以下两种样本选择cases。 1.希望仅对具有本市户口的家庭住房状况进行分析,因此应只选择本市户口的住户为样本。 2.希望对全部样本的70%进行分析,因此应用随机选取中的近似选取方法进行抽样。 3.4 计数 (1)含义: 对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。 (2)菜单选项: transform - count - define value 产生计数变量 (3)指定区域的定义 Value:指定一个值 system-missing:系统缺失值 system-or user missing:系统或用户缺失值 range through:指定一个闭区域,给出最大和最小值 range: lowest through n:最小值到某个给定值 range: n through highest:某个给定值到最大值 举例: 住房现状调查数据,分析被调查家庭中有多少比例的家庭对目前的住房满意且近三年不准备购买住房。 3.5 分类汇总 (1)含义: 按指定的分类变量的变量值对个案分组; 计算每组个案的汇总变量的基本统计量; 将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。 3.5 分类汇总 (2)菜单选项: data - aggregate (3)说明: 多重分组时,变量名的选择顺序。 生成的新文件名默认为:aggr.sav。可修改。 生成的新变量名默认为原变量名后加_1。可修改。 可以在新文件中存贮个分组个案数. 举例: 住房状况调查数据,分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否有较大差距,未来打算购买住房的平均面积是否有较大差距。 3.6指定加权变量 (1)含义: 指定某一变量为加权变量。如:平均蔬菜价格、男足打分 (2)菜单选项: data - weight case (3)说明 如果取消加权变量应重新定义: data-weight case do not wei

文档评论(0)

xiaoga123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档