- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章变量级别的数据管理
第3章 变量级别的数据管理; 数据管理:对数据进行加工处理。对同一个数据需进行不同侧面的研究,可采取多种统计方法,不同的统计方法对数据文件结构的要求不同,这需要对数据文件的结构进行重新调整或转换,以便适用于相应的统计方法。数据管理直接关系到数据分析的结果。
数据文件的管理功能集中于:
“转换”(Transform)菜单——变量级别管理
“数据”(Data)菜单——文件级别管理; “转换”(Transform)菜单的项目分
为几类:
计算新变量:“计算变量”(Compute)过程;
变量转换:
“重新编码”(Recode)
“离散化”(Visual Bander)
“计数”(Count)
“个案排秩”(Rank Cases)
“自动重新编码”(Automatic Recode) ;专用过程:
日期/时间(Date/ Time )
创建时间序列(Create Time Series)
替换缺失值(Replace Missing Values)
随机数字生成器(Random Number Seed)
运行挂起的转换(Run Pending Transforms)
;3.1 变量赋值
所谓变量赋值是指在原有数据的基础上,根据用户的要求,使用SPSS算术表达式及函数,对所有记录或满足条件表达式的某些记录进行四则运算,并将结果存入一个用户指定的变量中。该变量可以是一个新变量,也可以是一个已经存在的变量。;3.1.1常用基本概念
1.算术表达式(Numeric Expression),用于进行变量转换,是由常量、变量名、算术运算符、圆括号等组成的式子。
2.函数,有70余种系统函数,分为8类,包括算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数。函数名(参数)是函数具体的书写形式,系统已经规定好的;圆括号中的参数可是一个或多个(多个参数之间用单字符逗号隔开);参数类型:常量、变量、算术表达式。
3.条件表达式和逻辑表达式,是对指定部分记录进行计算和逻辑运算。
如果上述三者同时出现,要先满足条件后计算。;3.1.2 “计算变量”过程
“计算变量” (Compute)
利用算术符号和函数生成新结果,
结果保存到指定变量中,指定变量可
以是新变量,也可以是一个已存在的
变量。;例3.1 将年龄分为3组。
又??1 数据transform.sav
平均成绩=(语文成绩+数学成绩+英语成绩)/3
英语成绩在60分以上的学生语文和数学的平均成绩
;又例2 调整后工资计算“个人”所得税。调整后工资额小于1200元,税为0;工资额在1200-1700之间,税为(调整后工资额-1200)×0.05;工资额在1700-3200元之间,税为(调整后工资额-1200) ×0.1-25;工资额在3200-6200元之间,税为(调整后工资额-1200) ×0.15-125。
又例3 辽宁样本家暴课题数据(部分)中,“出生年”变量计算为新变量“年龄”。;3. 2 对已有变量值的分组合并
重新编码(Recode)
连续变量转换为等级变量(分类变量或离散变量),如年龄、收入;
将数值型变量转换为字符型变量,将字符型变量转换为数值型变量;
将分类变量不同的变量等级进行合并,如教育程度;
重新编码为相同变量(Recode into Same Variable)和重新编码为不同变量(Recode into Different Variable )。;3.2.1 对连续变量进行分组合并
连续变量转换为离散变量(等级或定序变量),生成新变量值,新值可赋给原变量,可生成新变量。
通过两个过程实现:“重新编码”(Recode)和 “离散化分段”(Visual Bander)
例3.2 以例3.1运用“重新编码”过程操作。
; 又例 数据transform.sav 生成新变量grade。当英语成绩小于60分取值为“不及格”,60-70分为“及格”,70-80分为“良好”,大于等于80分为“优秀”。
3.2.2分类变量类别的合并
还以例3.1运用“重新编码”过程操作。
又例 数据transform.sav 生成新变量grade2,将grade中的优秀、良好和及格合并为“PASS”等级,将“不及格”转化为“NOPASS”。;3.3 连续变量的离散化
3.3.1 可视离散化过程
“可视离散化” (Visual Bander)
SPSS12.0中新增的功能;
可以进行等距分组,或等样本量分组;
采用图形化的操作方式。
例3.2 将S3年龄变量等间距分为10组。;3.3.2 最优离散
您可能关注的文档
最近下载
- DBJT 08-120-2015雨水口标准图2015沪S203.docx VIP
- 神经介入产品培训.ppt VIP
- 重庆市綦江区郭扶镇社区工作者招聘考试试题汇总2024.docx VIP
- ECharts数据可视化课件 第1章 初识ECharts.pptx VIP
- 重庆市綦江区安稳镇社区工作者招聘考试试题汇总2024.docx VIP
- 突发事故处理流程.pdf VIP
- 电工安全生产协议书(完整版).docx VIP
- 固定翼无人机技术完整全套教学课件.pdf
- 1.35KV预制舱变电站项目(整套35KV预制舱,变压器,开关柜,火灾报警)技术规范书.doc VIP
- DB36_T 811-2020 井冈蜜柚 生产技术规程.pdf VIP
文档评论(0)