SPSS课件第二章 数据文件的整理.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据文件的整理 辽 宁 医 学 院 温有锋 数据编辑 数据结构 数据选择 一、数据编辑 1、定义变量特征(Define Variable Properties) 根据需要对变量进行定义 拷贝变量特征(Copy variable properties) 定义时间(Define dates):主要用于时间序列分析 插入变量(Insert variable) 插入观测量(Insert case) 定位到某一观测量(Go to case) 二、数据结构 观测量排序(Sort Case) 2、数据转置(Transpose) 将原始数据的行和列进行转换,使新文件的行是原文件的列,新文件的列是原文件的行。(05-01) 3、重建数据结构(Restructure) 4、合并文件(Merge Files) 4.1 添加观察单位(Add Case) 只合并两个数据文件中具有相同变量名的数据 追加合并外部数据文件中变量名不同的观测量 Data0503,Data0504 4.1.1 只合并两个数据文件中具有相同文件名的数据 4.1.2 追加合并外部数据文件中变量名不同的观测量 追加合并外部数据文件中变量名不同的观测量应遵循的原则 在两个数据文件中变量名不同的观测量,可以把它们配对为相互匹配的变量,并将它们选入新的数据文件中; 一个数据文件中被设为数值型变量的观测量,不能与其他文件被设置为字符型的观测量进行追加合并; 不同宽度的字符变量必须先将它们的宽度设置为一致后才能进行观测量的合并; 如果强行将不匹配的变量选入新的数据文件中,有可能造成数据的遗失。 4.1.2追加合并外部数据文件中变量名不同的观测量 4.2 添加变量(Add Variables) 增加变量的两种方式: 从外部数据文件中获取一些变量数据加入当前数据文件中 关键变量合并 4.2.1从外部数据文件中获取一些变量数据加入当前数据文件中 Data05-05,Data05-06 4.2.2 关键变量合并 关键变量合并需要注意: 两个数据文件之中一定要有一个共同的关键变量 两个数据文件的关键变量之中有一定数量的相同值的观测单位 关键变量按相同顺序排序 Data05-05,Data05-06 5、数据分类汇总(Aggregate Data) 数据处理中,有时需要将某些中间变量,如均数、标准差、最小值、最大值等形成一个新的数据文件,此时可应用数据分类汇总实现这一功能 例:为测量人类脊柱椎体的矢状面管径,以216个椎体为研究对象,每个椎体测量4次,数据见diameter.sav。请以4次均值形成新的数据文件。 6、辨识重复观察单位(Identify Duplicate Cases) 辨识重复观察单位的功能主要用于数据的核查,以免某个观察单位被重复录入。 这项功能还可以用于病例对照设计中匹配对象的选择。 7、正交设计(Orthogonal Design) 正交设计资料的方差分析 三、数据选择 拆分文件(Split Files) 选择观察单位(Select Cases) 变量加权(Weight Cases) 1、文件拆分(Split Files) 数据处理时需要将某些分类变量进行分层分析,此时要通过拆分文件实现 例如对性别中的男性和女性分别进行分析 2、选择观察单位(Select Cases) 数据分析中,有时可能只对某一分类变量的其中几个水平(或组)感兴趣;或者在判别分析时,可能用其中90%的观察单位建立判别函数,用其余10%的观察单位考核判别函数;或者只对某一时间或某一编号范围的观察单位感兴趣。此时可以用select菜单实现(data-0903)。 All cases: 选择全部观察单位 If condition is satisfied:选择满足条件的观察单位 Random sample of cases: 随机抽取一定比例或数量的观察单位 Base time or case range: 按观察单位的编号范围选取观察单位 Use filter variable:用过滤变量选取观察单位 练习 Clinical.sav 选择男性观察单位 随机选择70%的观察单位 选择前106个观察单位中的34个观察单位 随机选择32个观察单位 3、变量加权(Weight Cases) 变量加权(Weight Cases)是指对变量、特别是频数变量赋以权重,常用于频数表资料,如列联表资料和等级资料频数表,加权后的变量被说明成频数。 Do not weight cases:不对变量加权 Weight case by:指定频数变量,对变量进行加权,即把变量值定义为频数 * 辽宁医学院 SPSS统计软件应用

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档