- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS数据及预处理
第三章 SPSS数据的预处理
为什么查进行预处理
在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。数据的预加工处理服务于数据分析和建模,主要包括以下几个问题:
数据的排序
变量计算
数据选取
计数
分类汇总
数据分组
数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。
3.1 数据的排序
3.1.1数据排序的作用
3.1.2 数据排序的基本操作
将观测量按照统计分析的具体要求进行合理的分类整理是数据文件整理的重要工作。仍以文件“研究生.sav”来说明,观测量分类整理的基本操作步骤如下:
(1)执行Data→Sort Cases (观测量分类) 命令,打开Sort Cases对话框。
(2)从源变量列表框中选择一个或几个分类变量,单击中间的箭头按钮将它们移入Sort by框中,不妨称移入该框的变量为By变量。选择By变量的意义是将按这个变量对观测量进行分类整理。如果选择了几个By变量,从上至下依次称为第一By变量、第二By变量等。分类整理将按每一个By变量层叠分类整理。例如,选择了两个分类变量,sex为第一By变量,score为第二By变量,在sex的每一个分类中观测值将按score分类。
(3)在Sort Order栏中选择一种排序方式。如对某分类变量选择Ascending (升序),则在Sort by框里该变量名之后用连线连接Ascending;如选择Descending (降序),该变量名连接Descending。各分类变量的排序方式可以不同。
(4)以上选择确定后,单击OK,返回数据窗口,分类排序结果显示于数据窗口内。
此外,对字符串变量按分类次序大写字母将优先于小写的同一字母。在我们引用的数本来有一个Order (序号) 变量,它的值为自然数顺序。按照某些By变量分类后,要将文件恢复成原来的顺序,可以再用Order作为By变量执行观测量分类即可。如果文件缺少这样一个变量,经过分类的文件将不能恢复原状。SPSS的许多系统数据文件中都包含一个标志观测量序号的“id’(单词identity的头两个字母)变量,它就可以起到这个作用。
3.2 变量计算
3.2.1 变量计算的目的
略
3.2.2 SPSS条件表达式
条件表达式(If..)及其对话框的使用。有时候,仅仅需要对一些符合某些特定条件的自变量的观察值来进行计算。例如,在记录某年级3班和6班学生成绩的数据文件中,我们只需要了解3班女同学的学习情况,需要计算她们各门功课平均成绩,即需选择满足条件“sex=0 & class=3”(即三班女学生)的观测值来计算。当条件表达式“sex=0”和“class=3”同时为真时,计算平均成绩。对使表达式为假的或缺失的观测量就不计算这个值,对应于这些观测量,新变量的值为系统缺失值。
在Compute Variable对话框中单击If…按钮,打开If Cases条件对话框。
对话框上方有两个单选项:
Include all cases:对所有观测量计算新变量值,相当于不设条件,为系统默认的选项。
Include if cases satisfies condition:对满足条件的观测量计算新变量值。此时,源变量清单栏、表达式栏、函数栏同时被激活,将条件表达式输入表达式框。
单击Continue 按钮对设定的条件表达式加以确认,返回Compute Variable 主对话框。条件表达式的建立规则是:条件表达式中至少要包括一个关系运算符,也可以使用逻辑运算符,并且可以通过关系(或逻辑)运算符连接多个条件表达式。
各项选择确认后,单击OK。系统将根据表达式和条件计算新变量的值,并且将其结果显示到数据窗口的工作文件中
3.2.3SPSS算术表达式
在Compute 对话框中定义了计算表达式、目标函数,以及设置了计算条件后,单击主对话框的Paste 按钮,系统随即打开Systax 窗口,该窗口显示如下格式的命令语句。
(1)未设置计算条件情况下,COMPUTE命令语句:
COMPUTE 变量名=计算表达式.
EXECUTE.
其中:
命令关键字COMPUTE。
变量名即定义的目标变量名,它既可以是在主对话框Taget框中新定义的变量名,也可以是当前工作文件中已经存在的变量。
=等号。
计算表达式,表达式后接一个点“.”表示语句中止。计算表达式中的变量必须是工作文件中存在的变量。
● “EXECUTE.”为执行语句。
例如,假设表达式中的变量都是当前工作文件已经定义过的变量,则下列语句都是合法的COMPUTE命令:
COMPUTE average=(math十physical十chemi
文档评论(0)