薛薇,《SPSS统计分析方法及应用》第三章 数据预处理.ppt

薛薇,《SPSS统计分析方法及应用》第三章 数据预处理.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
薛薇,《SPSS统计分析方法及应用》第三章 数据预处理

3.7.1 数据转置(略) 将数据编辑窗口中的数据进行行、列互换 【数据】→【转置】 要指定数据转置后要保留哪些变量,将他们选入【变量】框中; 还要指定转置后各变量名如何命名,应选择一个取值唯一的变量(如职工号)作为标记变量到 【名称变量】框中 转置图示 例如,计算蔬菜平均销售价格——以销售量为权数求平均 操作:采用【数据】→【加权个案】 选择【加权个案】项,并选择“销售量”为加权变量到【频率变量】框中 SPSS对数据的拆分与数据排序很相似,是根据指定变量对数据进行分组。 选择【数据】→【拆分文件】 然后选择拆分变量到【分组方式】中 * * * * * 本章教学内容及目标: 掌握SPSS数据筛选、排序、计数、汇总等基本操作 掌握SPSS组距分组的具体操作。 排序目的: 数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等; 通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度; 通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。 排序方法: (1)单值排序,指排序变量只有一个 (2)多重排序,首先按照主排序变量的大小次序排序,对于有相同主排序变量的数据,再按第二排序变量的大小次序依次安排。 说明: 1、数据排序是整行数据排序,而不是只对某列变量排序; 2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序; 3、数据排序后,原有数据的排序次序必然被打乱。 操作例子:职工住房状况调查 要求:分析本市户口和外地户口家庭的住房面积情况。 方法: 采用多重排序,主排序变量为本市户口,【数据】→【排序个案】 然后指定主排序变量到【排序依据】中,并在【排列顺序】中升序或者降序 注意:数据排序是整行数据排序,不只是对某列变量排序。 数据计算的目的:数据的转换处理是在原有数据的基础上,计算产生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有效的特点。 SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。(1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。(2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。 变量计算中有三个概念: 一、SPSS算术表达式(numeric expression) 它是由变量、常量、算术运算符、括号、函数等组成的式子。 运算先后顺序:自左向右,先算括号内的;先计算乘方(**),再计算乘(*)、除(/),最后计算加(+)、减(—) 1、简单的表达式 由SPSS关系运算符、变量、常量以及算术表达式组成的式子。 其中关系运算符: (大于)、 (小于)、=(等于)、 ~=(不等于)、=(大于等于)、=(小于等于)。 举例:nl35、sr=700。 2、复合条件表达式 又称逻辑表达式,由逻辑运算符、括号和简单条件表达式组成。 逻辑运算符:(AND) 并且、│ (OR) 或者、~(NOT) 非。Not运算符优先、其次and、最低是or。但可以用括号改变运算次序。 如:(nl=35) and (sr=700) (nl35) | (sr=700) 三是函数指事先编好的并储存在SPSS 软件中,能够事先按照某些特定任务完成计算的一段计算机程序。运行后,会得到一个函数值。 结构:函数名(参数) 括号中参数可以是常量(字符型常量用引号括起来),也可以是变量或算术表达式。参数可以是多个,需要用逗号分开。 SPSS函数有算术函数、统计函数、与分布相关的函数、查找函数、字符函数、缺失值函数,以及其它函数等(见课本:p41) 操作: 【转换】→【计算变量】 在【目标变量】输入存放计算结果的变量名 在【如果个案满足条件则包括】选项中输入条件表达式。 依据职称级别计算实发工资 (sr-bx)*0.5(0.3) 3.3 数据选取 一、数据选取的目的 数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。 SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取,这样后面的分析操作就只针对选出的数据,直到用户取消这种选取为止。 提高数据的分析效率,检验模型的需要(

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档