- 1、本文档共79页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例5 仍以数据fee.sav为例,根据城市分组计算住院总费用的 秩次。 例6 仍以数据fee.sav为例,将字符型变量city转化成数值变量newcity。 查看特定变量值 查看特定变量值 查看特定变量值 变量编秩 变量编秩 用于定义秩次类型,默认为rank(秩分数) 变量编秩 用于定义对相同值观测量的处理方式 默认值为取平均秩次。 变量编秩 变量编秩 将字符变量转换为数值变量 数据汇总 分组变量 被汇总变量 数据汇总 定义汇总函数 定义新产生汇总变量的 名称和标签 Function NameLabel 数据汇总 查找重复记录 希望查找重复值的变量 重复记录按该变量的取值排序 设定第一个还是最后一个重复记录为主记录 查找重复记录 PrimaryLast=0表示相应的记录为重复记录 查找重复记录 变量级别的数据管理(1) SPSS中的Transform菜单提供了变量级别的数据管理,可以对变量进行操作。 计算新变量(Compute):最常用 Recode:对变量值进行分组合并 Visual Bander:连续变量的可视化分段 Count:表示某个变量的取值中是否出现某个值,或 某个区间 Rank Cases:变量编秩 Automatic Recode:对记录按某个变量值的大小排序 变量转换 变量级别的数据管理(2) Create Time Series:建立时间序列 Replace Missing Values:缺失值替代 Random Number Seed:设定随机种子 专用过程 变量级别的数据管理(3) 控制命令 Run Pending Transforms:用于执行编程中被 挂起的数据整理操作 专用于时间序列模型 例1 数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院病人平均每天的住院费用,要求结果取整。 计算新变量 输入新变量名perfee 计算新变量 计算新变量 输入条件表达式 计算新变量 选择函数 输入函数表达式 计算新变量 例2 在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。 变量值分组合并 新变量名 grade 选入原变量total 变量值分组合并 变量值分组合并 三种Range的设置,所有的范围均包含了端点,而前面设定的变换会优于后面的变换,因此应该将大于等于10000元最先设定,而将小于5000元最后设定。 变量值分组合并 变量值分组合并 变量值分组合并 变量值分组合并 务必选上该项 变量值分组合并 变量值分组合并 recode过程提供了精确分组的功能,但如果希望进行的分 组是有规律的,比如等距分组,或等样本量分组,使用 recode过程进行操作就显得非常麻烦,且可视化程度不高。 此时可以考虑使用visual bander过程进行可视化分段。 连续变量的可视化分段 例3 仍以数据fee.sav为例,按变量total将病人分为5组,5000元以下为第一组,5000元以上的按等间距的方式分4组。 连续变量的可视化分段 连续变量的可视化分段 连续变量的可视化分段 设定分段规则 连续变量的可视化分段 连续变量的可视化分段 自动填充 值标签 连续变量的可视化分段 例4 仍以数据fee.sav为例,查看变量total中是否出现值6890。 查看特定变量值 查看特定变量值 数据管理 在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。 数据管理 文件级别的数据管理 变量级别的数据管理 文件级别的数据管理(1) SPSS中的Data菜单提供了文件级别的数据管理,可以对整个数据文件进行加工整理。 Insert Variable:插入变量 Insert Cases:插入记录 Go to Case:到达某条记录 简单命令(这些功能都可以用鼠标在数据表界面 直接完成,很少用菜单操作,在此不详述) Sort Cases:记录排序 Split File:记录拆分 Select Cases:记录筛选 Weight Cases:记录加权 常用的简单过程(使用频繁,必须掌握) 文件级别的数据管理(2) Define Variable Properties:定义数据字典 Cop
文档评论(0)