第3章变量级别的数据管理选读.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 变量级别的数据管理 3.1 变量赋值 3.2 已有变量的分组合并 3.3 连续性变量的离散化 3.4 变量的自动重编码与数值移动 3.5 转换菜单中的其他功能 数据管理 针对同一个研究目的,往往要从不同的侧面对数据进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件结构进行重新调整或转换,以便适合于响应的统计方法使用 在SPSS中,数据、文件的管理功能主要集中在“转换”和“数据”两个菜单中。 转换 —— 实现变量级别的数据管理,主要与变量数值的转换有关 数据 —— 实现文件级别的数据管理,如文件合并、拆分等 3.1 变量赋值 变量赋值:在原有数据的基础上,根据用户要求,使用SPSS算数表达式及函数,对所有记录或满足SPSS条件表达式的某些记录进行四则运算,并将结果存入一个用户指定的变量中。该指定变量可以是一个新变量,也可以是一个已经存在的变量 变量赋值是极为常用的操作,大致可占数据管理操作的一半以上 3.1.1 常用基本概念 在变量转换过程中,应根据实际需要,指出要按照什么方法进行变量转换,这里的方法一般以SPSS算数表达式的形式给出 1. 算数表达式 SPSS算数表达式(Numeric Expression)是由常量、SPSS变量名、SPSS算术运算符、圆括号等组成的式子,参与运算的数据类型和最终结果均为数值型,字符型、日期型变量和常量则要先进行函数转换然后才能参与运算 算术表达式中的运算符由+、-、*、/、**(乘方)构成,运算顺序以及括号的使用均遵循四则运算法则 3.1.1 常用基本概念 根据函数功能和处理对象的不同,可以将SPSS函数分成8类,分别是算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数 2. 函数 函数的具体书写形式:函数名(参数),这里,函数名是系统已经规定好的。圆括号中的参数有时是一个,也可以是多个;参数的类型有时是常量(字符型常量应用单引号括起来),也可以是变量名或SPSS的算术表达式。此外,函数中如果有多个参数,各参数之间要用单字符逗号“,”隔开 3.1.1 常用基本概念 3. 条件表达式与逻辑表达式 通过SPSS的算数表达式和函数对所有记录进行计算时会得到一个结果,如果仅希望对部分记录进行计算,则应当利用SPSS的条件表达式指定对哪些记录进行计算。 根据实际需要构造条件表达式之后,SPSS将对条件表达式进行计算得到一个逻辑常量(真或非真),然后从所有记录中自动挑出满足该条件的记录,然后再对它们进行计算处理 在SPSS中条件表达式常用的关系运算符由以下几种: = = = ~=(不等于,NE) 除了条件表达式外,在SPSS中还会使用到逻辑表达式,其作用和赋值类型均类似于条件表达式,只是会用到以下3个逻辑运算符: | ~ ,分别表示AND、OR、NOT 3.1.2 “计算变量”对话框 3.1.2 “计算变量”对话框 “目标变量”文本框:用于输入需要赋值的变量,在输入变量后,下方的“类型与标签”按钮就会变黑,可以在这里对变量进行具体的定义,但在大多数情况下都是不需要的 “候选变量列表” :位于“目标变量”文本框下方 “数字表达式”文本框 :用于给目标变量赋值 “软键盘” “函数列表” :分为“函数组”列表框、“函数和特殊变量”和函数解释文字文本框 “如果” :用于对个案筛选条件进行设定,默认选中“包括所有个案”单选按钮,入股需要进行个案筛选,则可以更改为“如果个案满足条件则包括”,然后再下方的表达式文本框中输入相应筛选条件即可 3.1.3 案例:年龄变量的分组 例3.1:CCSS项目中的受访者年龄为18-64岁,分析时将其分为18-34、35-54、55-64三组。为了便于使用,年龄变量S3被重新赋值后将会保存为新变量TS3,其取值1、2、3分别代表上述3种情况 3.2 已有变量值得分组合并 在数据分析中,将连续变量转变为等级变量,或者将分类变量不同的变量等级进行合并是常见的工作,通过变量重编码可以很好地完成这一类任务 “重新编码为相同变量”:对原始变量进行直接重编码,替换原数值 “重新编码为不同变量”:根据原始变量的取值生成一个新变量来记录重编码结果 上述两个过程除了输出目标不同之外,其余功能非常类似 3.2.1 对连续性变量进行分组合并 转换重新编码为不同变量 3.2.1 对连续性变量进行分组合并 转换重新编码为不同变量 3.3 连续性变量的离散化 可视离散化过程 最优离散化过程 3.3.1 可视离散化过程 可视离散化过程:用于在可视界面下将连续变量进行分段,在该过程中可以使用百分位数、标准差范围或者等间距方式将连续性变量划分为若干组段,并采用图形化操作方式,非常直观 例3.2:将S

文档评论(0)

502992 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档