- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 SPSS数据预处理
第四章 SPSS数据预处理 本章学习的目的 通过本章教学,使学员熟练掌握SPSS数 据筛选的基本方法和具体操作;熟练掌握SPSS 数据排序、计数的具体操作;掌握SPSS分类汇 总的含义并熟练掌握其具体操作;掌握各种数据 分组的特点和适用场合,并熟练掌握SPSS组距 分组的具体操作;掌握利用加权功能还原SPSS 计数数据为原始数据的方法。 本章内容 引言 4.1 数据说明 4.2 整理数据文件 4.3 对数据进行分类汇总 4.4 对观测量加权处理 4.5 定义和应用变量集 引言 当数据窗中已经建立或读入了一个数据文件后,就可以对该数据文件进行分析了。但在许多情况下,SPSS的分析过程往往对数据的格式有特殊的要求,需要对数据文件进行调整,然后对数据进行统计分析。 1 缺失值和异常数据的处理 2 数据的转换处理 3 数据抽样 4 选取变量 4.1 数据说明 数据背景: 第一个数据是:某省城镇居民收 入与支出相关调查数据,共有91个变 量:czjmsz.sav。 第二个数据是:某省城镇居民基本信息数据。 对上述数据进行预处理分析 4.2 整理数据文件 在许多情况下,SPSS的分析过程往往对数据有特殊的要求,需要对数据文件进行进一步的加工处理。一般的包括: 观测量数据的排序(Data-Sort Cases) 为观测量排秩(Transform-Rank Cases) 数据转换(Transform-Count) 对变量值重新编码(Transform-Recode) 对变量值自动编码(Transform-Automatic Recode) 计算产生新变量(Transform-Compute) 数据文件的转置(Data-Transpose) 拆分数据文件(Data-Split Files) 合并数据文件(Data-Merge Files) 4.2.1 观测量数据的排序 根据某些变量值重新排列各观测量Case在数据文件中出现的先后顺序,如:按高矮排队、按成绩排名等 菜单:DATA+Sort Cases a. 选择Sort by变量 b. 升序或降序 如czjumsz数据文件,按总收入变量排序(降序) 4.2.2 为观测量排秩 求某个变量值的秩(Rank), 用一个新变量(r+原名)保存,而不改变观测量Case原来的顺序,如:求名次 菜单: Transform+Rank Cases a. 选变量:每个变量产生一个秩变量 b. 选择秩的排列方式:将最小的数值的秩定为1(升序)或将最大的数值的秩定为1(降序) c. 是否分组(BY变量):分别从1开始排名,如对男女生分别排名 d.Ties(结值)的不同处理方式: Mean,Low,High,Sequential 4.2.3 数据转换 每个受调查的城镇居民在收入的四个方面超过1万元的个数,将统计结果放在新变量srtj。 菜单: Transform+Count a.新变量名(Target Variable):srtj b.参与统计的数值型变量:4个收入变量名 c. Define Values:1(当4个变量的值是否超过为10000时, Count计数) d . If:可设置条件 4.2.4 对变量值重新编码 经常需要将一些定距变量重新编码称为定序变量,以便进行统计分析,如年龄-老中青,收入-高中低,受教育年限-高中及以下、大专、大本及以上 菜单: Transform+ Recode 对家庭资料个人资料进行重新编码: 将对家庭成员受教育程度进行重新编码。 4.2.5 对变量值自动编码 当分类编码不具有连续性数值时,产生的空单元格会降低一些运算过程的能力和增加对内存的需求。此外,一些统计过程不能用字符型变量值,有些统计运算过程需要用整数值表示因子水平。SPSS提供了Automatic Recode自动编码命令,将数值型变量和字符型变量转变为连续整数。 菜单: Transform-Automatic Recode 4.2.7 数据文件的转置 行列互换:数据文件的行--列,列--行 菜单: Data+Transpose a. 选变量,没选的将不转置 b.从源变量框中选择要作为“名称变量”的变量进入Name Variable(可缺) 4.2.8 拆分数据文件 在进行数据处理时经常要对数据文件中的观测量进行分组分析,但有些分析功能没有设置对分组变量的选择项。如想使用Descriptives功能分别求男生、女生的平均分数。在进行分析之前必须对该数据文件进行拆分。 这里的“拆分”,是对观测量的分组,非真的拆分文件。 菜单: Data+Split File 选择要分组的变量(=
您可能关注的文档
最近下载
- 2023年06月国家国防科技工业局核技术支持中心社会招考聘用笔试历年难、易错考点试题含答案解析.docx
- 人教版七年级上册英语单词表2115.pdf VIP
- 台达 VFDB4132系列刹车模块说明书.pdf
- 河南省郑州市外国语学校2025-2026学年高三上学期第三次阶段检测语文试题(含答案及解析).docx VIP
- 中国马克思主义与当代知到智慧树期末考试答案题库2024年秋北京工业大学.docx VIP
- 2024最新不予立案通知书.doc VIP
- 工业网络技术教材PPT10 Modbus TCP通信及应用.pptx VIP
- 2025年中国亚克力镜面板市场调查研究报告.docx
- 账号内容打造方案.docx VIP
- 锋芒全系列笔记低吸有道系统课程.pdf VIP
原创力文档


文档评论(0)