- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS据的预处理
第三章 SPSS数据的预处理 3.1 数据的排序 3.2 变量的计算 3.3 数据选取 3.4 计数 3.5 分类汇总 3.6 数据分组 3.7 数据预处理的其他功能 3.1 数据的排序(Data-Sort Cases) 将记录按ID变量排序,有利于查找、修改; 将某个变量按升序或降序排列,可以非常容易的发现输入错误,因为他们往往就是最大/最小值; 缺失值在排序中会排在最小值的前面,可以通过排序的方法很快发现那些记录为缺失值; 包括单值排序和多重排序; 例1:将“职工数据.sav”文件,按职称降序和工资收入升序重新排列。 例2:“住房状况调查.sav”,通过排序分析本市户口和外市户口的住房面积情况 3.2 变量的计算( Transform-Compute) 在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量 用于计算新变量,或者给老变量赋值 有大量的SPSS函数可供使用 学会如何写相应的语句可能更方便 实例 依据“职工数据.sav”按职称级别计算实发工资,计算规则:实发工资等于基本工资减去失业保险,之后,依据职称1~4等级分别将以上计算结果上浮5%,3%,2%,1%。 SPSS 算术表达式 由常量、变量、算术运算符、圆括号、函数等组成的式子 字符型常量用引号引起来 算术运算符包括:+、-、×、/、**(乘方) 运算先后顺序为先乘方,再乘除,最后加减。同级运算时按从左到右的顺序进行,遇括号改变运算顺序 同一表达式中常量及变量,数据类型应该保持一致 SPSS 条件表达式 对条件进行判断的式子。其结果有两种取值:如果判断条件成立,则结果为真;反之,则假 简单条件表达式 由关系运算符、常量、变量及算术表达式组成。关系运算符包括、、=、~=(不等于)、=、=。如nl35 复合条件表达式 由逻辑运算符、圆括号和简单条件表达式等组成的式子。逻辑运算符有(或AND)、︱(或OR)、~(或NOT)。 NOT的运算最优先,其次是AND,最低是OR 如(nl=35) and not (zc3) SPSS 函数 事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。 书写的具体形式为:函数名(参数),其中参数可以是常量也可以是变量或算术表达式 SPSS函数大致分为八大类,分别是算术函数、统计函数、分布函数、逻辑函数、字符函数、缺失值函数、日期函数和其它函数 3.3 数据选取( Data-Select Cases) 按要求筛选出数据集的一部分 可以使用组合条件进行筛选 按指定条件选取;随机选取(包括近似选取和精确选取);选取某一区域内的样本;通过过滤变量选取。 可以直接在数据集中抽样 例:在“住房状况调查.sav”的数据文件中,按不同条件选择个案: 只选本市户口的住户 选择全部样本的70% 从前15个个案中随机选择3个个案 选择第3到第6个个案 选出未来三年变量的缺失值 3.4 计数(Transform-Count) 计算某个值或某个区间的值出现的次数 步骤:①指定哪些变量参与计数,计算结果存入哪个新变量;②指定计数区间 例: “住房状况调查.sav”中,分析被调查家庭中有多少比例的家庭对目前的住房满意且近几年不准备购买住房。 例: “学生数据.sav”中,分析学生各科成绩优秀、良好的门数。 3.5 分类汇总( Data-Aggregate) 按指定的分类变量对观测值进行分组,对每组记录的各变量求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。 例: “住房状况调查.sav”中,分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否有较大差距,未来打算购买住房的平均面积是否有较大差距。 注意:这里指的是希望将原数据文件分类汇总为一个新的汇总数据文件进行分析,如果只是希望进行汇总描叙,则有相应的统计分析功能可以完成,不需要使用本过程 3.6 数据分组( Transform-Recode) 将数据按照某种标准重新划分为不同类型: Recode into same variable Recode into different variable 对连续型变量进行分组 【例】:在“学生数据.sav”中生成新变量grade,当英语成绩小于60分时取值“不及格”,大于等于60分且小于70分为“及格”,大于等于70且小于80为“较好”,大于等于80为“优秀”。 【注】端点值:前面的设定优于后面 分类变量类别的合并 【例】:将上例在数据“学生数据.sav”中生成的变量grade中的“优秀”、“良好”、“及格”三个等级合并为等级“PASS”,将grade等级“不及格”转化成“NOPASS”。 3.7 数据预处理的其他功能 Data-Tr
文档评论(0)