应用统计学数据管理-业务分析-全文在线阅读-.pptxVIP

应用统计学数据管理-业务分析-全文在线阅读-.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据管理;数据管理;文件级别的数据管理(1);简单命令(这些功能都可以用鼠标在数据表界面直接完成,很少用菜单操作,在此不详述) Insert Variable:插入变量 Insert Cases:插入记录 Go to Case:到达某条记录 常用的简单过程(使用频繁,必须掌握) Sort Cases:记录排序 Split File:记录拆分 Select Cases:记录筛选 Weight Cases:记录加权;变量与数据文件属性向导(对大型或连续性数据分析项目非常有用) Define Variable Properties:定义数据字典 Copy Variable Properties :将预定义的数据字典直接引入当前数据文件,即复制外部数据文件属性到当前数据文件 数据重构向导 Transpose:数据转置 Restructure:数据文件的重新排列;文件合并过程(Merge Files) Add Cases:纵向合并 Add Variable :横向合并 正交设计过程(Orthogonal Design) 其他过程 Define Dates:定义日期变量过程,用于时间序列数据 Aggregate:数据汇总过程 Identify Duplicate Cases:查找重复记录;单变量排序:SPSS提供了一种简易操作方法, 即在数据表格的变量名处单击右键,弹出右图;记录排序;选中District ,选择升序选钮(默认),将District选入Sort by;注意: 在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序 排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱;记录拆分;1 2 3 4 5 6 选中此框不拆分文件 按所选变量拆分文件,各组分析结果放在一起便于比 3较3较.按所选变量拆分文件,各组分析结果单独放置 用于选择拆分数据文件的变量 要求将数据按所用拆分变量排序 数据集很大,且拆分变量已排序,选此可节省运行时间;记录筛选;1;记录筛选;记录加权;· 设置作为权重的变量,如第一行表示agecat=1 gender=1的人共33个,accid表示人数,应设为权重;定义数据字典;变量名、测量尺度等;数据转置;· Transpose:该过程用于对数据进行行列转置,即原来的一条记录转成为一个变量,而变量则转成为一个记录,两次Transpose过程后数据集会恢复原样(点此见具体操作)。;将变量Group、x选入variable框,再点击OK键;数据文件重新排列;Restructure:此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。;数据文件重新排列;· 数据anxiety转换前后的长型格式和型格式;文件纵向合并;Add Cases:纵向合并,从外部数据文件中增加记录到当前数据文件中,相互合并的数据文件中应该有相同的变量。 左框:新、老数据文件中不匹配的变量名 *:当前数据集中的变量 +:新添加数据集中的变量 右框:已匹配的变量名,选择完成后单击OK即可;文件横向合并;Add Variables:横向合并,从外部数据文件增加变量到当前数据文件,两个数据集要有一个一一对应的关键变量进行匹配合并,且记录应按关键变量升序后再合并。 未被纳入的变量列 被纳入合并后新数据集的变量列表 记录匹配使用的关键变量;数据汇总;分组变量 被汇总变量;· 定义汇总函数;查找重复记录;希望查找重复值的变量 重复记录按该变量的取值排序;· PrimaryLast=0表示相应的记录为重复记录;变量级别的数据管理(1);计算新变量(Compute):最常用 变量转换 Recode:对变量值进行分组合并 Visual Bander:连续变量的可视化分段 Count:表示某个变量的取值中是否出现某个值,或某个区间 Rank Cases:变量编秩 Automatic Recode:对记录按某个变量值的大小排序;Create Time Series:建立时间序列 Replace Missing Values:缺失值替代 Random Number Seed:设定随机种子;例1 数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院病人平均每天的住院费用,要求结果取整。;输入新变量名perfee;计算新变量;计算新变量;计算新变量;变量值分组合并 例2 在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。;新变量名 grade;变量值分

文档评论(0)

151****7306 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档