- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章第三章SPSSSPSS数据的预处理数据的预处理
为什么要进行数据的预处理
在数据文件建立之后,通常还需要对分
析的数据进行必要的预加工处理,这是
数据分析过程中必不可少的数据分析过程中必不可少的一个关键步个关键步
骤。
数据的预加工处理服务于数据分析和建数据的预加工处理服务于数据分析和建
模,主要包括以下几个问题:
预处理的内容
数据的排序
变量计算变量计算
数据选取
计数
分类汇总分类汇总
数据分组
数据预处理的其他功能数据预处理的其他功能:转置转置、加权加权、数据数据
拆分、缺失值处理、数据排秩、定义变量集。
3.1 数据的排序
SPSS的数据排序是将数据编辑窗口中的
数据按照某个或多个指定变量的变量值数据按照某个或多个指定变量的变量值
升序或降序重新排列。这里的变量也称
为为排序变量排序变量。排序变量只有排序变量只有一个时个时,排排
序称为单值排序。排序变量有多个时,
排序称为排序称为多重排序多重排序。多重排序中多重排序中,第第一
个指定的排序变量称为主排序变量,其
他他依次指定的变次指定的变量分分别称为称为第第二排序变排序变
量、第三排序变量等。
3.1.1数据排序的目的
•• 数据排序便于数据的浏览数据排序便于数据的浏览,,有助于了解数据有助于了解数据
的取值状况、缺失值数量的多少等;
•• 通过数据排序能够通过数据排序能够快捷找到快捷找到数据的最大值和数据的最大值和
最小值,进而可以计算出数据的全距,初步
把握和比较数据的离散程度;
• 通过数据排序能够快捷地发现数据的异常值,
为进一步明确它们是否会对分析产生重要影
响提供帮助。
表3-1 数据排序举例
3.1.2 数据排序的基本操作
SPSS数据排序的基本操作步骤
(1)选择菜单数据-排序个案
((22))将主排序变量从左边的列表中选将主排序变量从左边的列表中选到到
排序依据框中,并在排序顺序框中选择
按该变量的升序还是降序排序。
((33))如果是多重排序如果是多重排序,还要还要一次指定第次指定第
二、第三排序变量及相应的排序顺序。
在左边的源变量框中
选择排序变量进入选择排序变量进入SortSort
by框。如果选择2个以 在Sort Order
上的变量上的变量,,列列于首位于首位 栏内选择排序
方式——升序
的为第一排序变量。
与降序
说明
1、数据排序是整行数据排序,而不是只对某列
变量排序变量排序;
2、多重排序中指定排序变量的次序很关键。先
指定的变量优先于后指定的变量。多重排序可
以在按某个变量值升序(或降序)排序的同时
再按其他变量值降序(或升序)排序;
3、数据排序后数据排序后,原有数据的排序次序原有数据的排序次序必然被打然被打
乱。
3.1.3数据排序应用举例
利用商品房购买意向的调查数据,通过数据排
序功能分别找到出租房和自有房中住房开销的
最大值和最大值和最小值最小值。。
3.2 变量计算
变量的转换处理是在原有数据的基础上,计算
产生一些含有更丰富信息的产生一些含有更丰富信息的新变量新变量。例如根据例如根据
职工的基本工资、失业保险、奖金等数据,计
算实际月收入算实际月收入,,这些新变量具有更直观更有效这些新变量具有更直观更有效
的特点。
可以对变量的分布进行变换可以对变量的分布进行变换。。如利用对数或多如利用对数或多
项式变换对非正态或非线性数据进行处理;对
时间序列进行平稳化处时间序列进行平稳化处理;;利用区间变换调整利用区间变换调整
数据的取值范围等等。
3.2.1 变量计算的目的
SPSS变量计算是在原有数据的基础上,根据用户
给出的给出的SPSSSPSS算术表达式以及函数算术表达式以及函数,,对所有个案或对所有个案或
文档评论(0)