spss第四章数据文件的操作与变换.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss第四章数据文件的操作与变换

二、重新编码为不同的变量 例:e410-2 要求:对口味变量进行如下编码: 好:1 较好:2 一般:3 差:4 其操作步骤如下: 1、 2、 3、 注:可一次同时对多个变量进行编码,但是这些变量必须具有相同的数据类型。如: 4.11 个案等级排序 个案等级排序是根据某变量观测值的大小,按一定顺序排秩,生成一代表其秩次的新变量,数据本身顺序并不改变。它与“排序个案”不同, “排序个案”是根据某变量观测值的大小将数据重新排列,并不生成新变量。个案等级排序的操作步骤如下: 注:此处的“排序标准”必须是数值型的,非数值型需转换成数值型。 结:处理同秩变量的不同方式 身高 低 平均值 高 顺序等级到唯一值 149 1 1 1 1 151 2 2.5 3 2 151 2 2.5 3 2 157 4 4 4 3 161 5 5 5 4 163 6 6 6 5 168 7 7 7 6 4.12 自动重新编码 在许多统计分析过程中,当分类变量不是连续数时,产生的空白单元会降低系统性能且增加对存储容量的需求。而且,某些过程不允许使用字符型变量作为衡量因素水平的标准,而要求使用连续整数值。采用自动编码可以将字符串和数值转换成连续整数,以满足某些分析过程的特殊需要。自动编码的操作过程如下: (e412-1) 4.13 创建时间变换 利用已存在的时间系列变量值,通过函数变换产生新变量,这些新变量的值在许多时间系列的分析过程中将要用到。时间系列变换的操作如下: 建立新变量时可使用的函数 1、差值(差分)(e413-1) 按差分的阶数可分为一阶差分、二阶差分,其计算方法为: 2、季节性差分(e413-2) 在计算季节性差分之前,必须先定义一个包含有周期成份的日期时间变量。 3、 中心移动平均值(413-3) 围绕当前值在一定范围内对变量的值求平均值。 跨度为2 时: 40.75=((48+38)/2+(38+39)/ 2)/2 跨度为3 时: 41.67=(48+38+39)/3 4、向前移移动平均值 求当前值的前方一定范围内的原始变量值的均值。 5. 运行中位数 围绕当前值在一定范围内对原始变量值求出中值。 跨度为2 时: 40.75=((48+38)/2+(38+39)/ 2)/2 跨度为3 时: 39=mid(48,38,39) 6、 累加求和(e413-6) 计算从第一个变量值起直到当前变量值的总和。 7. 延迟 当前变量的值等于相隔为延迟阶数的前面的变量值。 8、提前 当前变量的值等于相隔为前移阶数的后面的变量的值。 9、平滑 4.14 替换缺失值 在分析带有缺失值的观测数据时,通常将带有缺失值的观测量排除在分析数据范围之外,但在进行时间系列的统计分析时,不能将带有缺失值的观测量排除在外.此时可用替换缺失值的方法进行处理.其操作步骤如下: 替换缺失值的方法: 1、序列平均值: 用整列变量值的均值替代缺失值。如果变量值中含有多个缺失值,则它们都将由同一个值替换。(e414-1) 2、邻近

文档评论(0)

整理王 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档