- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
经典实用的spss课件 数据相关管理.ppt
数据管理; 在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。;文件级别的数据管理(1); Insert Variable:插入变量
Insert Cases:插入记录
Go to Case:到达某条记录; Define Variable Properties:定义数据字典
Copy Variable Properties :将预定义的数据
字典直接引入当前数据文件,即复制外部数据
文件属性到当前数据文件;记录排序;选中District ,选择升序选钮(默认),将District选入Sort by 框;注意:
在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序
排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱;记录拆分;1.选中此框不拆分文件;记录筛选;;记录筛选;记录加权; 设置作为权重的变量,如第一行表示agecat=1 gender=1的人共33个,accid表示人数,应设为权重;定义数据字典;变量名、测量尺度等;数据转置; Transpose:该过程用于对数据进行行列转置,即原来的一条记录转成为一个变量,而变量则转成为一个记录,两次Transpose过程后数据集会恢复原样(点此见具体操作)。;将变量Group、x选入variable框,再点击OK键;数据文件重新排列;Restructure:此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。;数据文件重新排列; 数据anxiety转换前后的长型格式和型格式;文件纵向合并;;文件横向合并;1. 未被纳入的变量列
2. 被纳入合并后新数据集的变量列表
3. 记录匹配使用的关键变量;数据汇总;分组变量; 定义汇总函数 ;查找重复记录;希望查找重复值的变量; PrimaryLast=0表示相应的记录为重复记录;变量级别的数据管理(1); 计算新变量(Compute):最常用; Create Time Series:建立时间序列
Replace Missing Values:缺失值替代
Random Number Seed:设定随机种子;例1 数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院??人平均每天的住院费用,要求结果取整。;输入新变量名perfee;计算新变量;计算新变量;计算新变量;例2 在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。;新变量名
grade;变量值分组合并;;变量值分组合并;变量值分组合并;变量值分组合并;务必选上该项;变量值分组合并; recode过程提供了精确分组的功能,但如果希望进行的分
组是有规律的,比如等距分组,或等样本量分组,使用
recode过程进行操作就显得非常麻烦,且可视化程度不高。
此时可以考虑使用visual bander过程进行可视化分段。;例3 仍以数据fee.sav为例,按变量total将病人分为5组,5000元以下为第一组,5000元以上的按等间距的方式分4组。;连续变量的可视化分段;连续变量的可视化分段;设定分段规则;连续变量的可视化分段;连续变量的可视化分段;例4 仍以数据fee.sav为例,查看变量total中是否出现值6890。;查看特定变量值;查看特定变量值;查看特定变量值;查看特定变量值;例5 仍以数据fee.sav为例,根据城市分组计算住院总费用的 秩次。;变量编秩; 用于定义秩次类型,默认为rank(秩分数); 用于定义对相同值观测量的处理方式
默认值为取平均秩次。;变量编秩;将字符变量转换为数值变量;将字符变量转换为数值变量;将字符变量转换为数值变量;将字符变量转换为数值变量
文档评论(0)