第04讲文件级别的数据管理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Lesson 4 文件级别的数据管理 选择transform2.sav后 选择transform3.sav后 五. 数据文件的重新排列与转置 有时用户要根据分析的要求改变数据的排列格式。 选择Data→Restructure 1.数据的长型与宽型格式 重复测量数据的两种不同排列方式,由于重复测量模型可以使用不同的统计模型加以分析,因此根据模型的要求进行长型与款型格式之间的互换是必要的。 长型格式的数据Anxiety.sav,共48条记录 宽型格式的数据Anxiety2.sav,共48条记录 2.长型格式转换成款型格式 例5.将Anxiety.sav转换为Anxiety2.sav的格式 。 款型转成长型 长型转成款型 行列转置 被重复观测的个体的变量 反应测量级别的变量 进一步询问是否根据所选变量排序,系统默认yes 此时可单击完成实现转换,也可按下一步继续操作。 结果窗口还会输出汇总表,用于检查操作是否有误。 3. 款型格式转换成长型格式 例6.将Anxiety2.sav转换为Anxiety.sav的格式 。 转换一组变量 转换多组变量 重复观测个体的标识变量 被转换的变量组 携带变量 用于设定重复测量指标变量 此时可单击完成实现转换,也可按下一步继续操作。 结果窗口还会输出汇总表,用于检查操作是否有误。 4. 数据转置 即将数据编辑窗口中的数据的行列互换,将记录转化为变量,将变量转化为记录后,重新显示在窗口中。一般情况下不需要进行数据转置,数据转置主要用于编程,进行矩阵运算时的矩阵转置操作。 五. 多个数据文件的合并 纵向连接:指几个数据集中的数据纵向相加,组成一个新的数据集,新数据集中的记录数是原来几个数据集中的记录数的总和。 横向合并:指按照记录次序或某个关键变量的数值,将不同数据集中的不同变量合并为一个数据集,新数据集中的变量数时所有原数据集中的不重变量名的总和。 1.纵向连接 纵向连接是将一个SPSS数据文件的内容追加到数据编辑窗口中当前数据的后面。其实质就是将两个数据文件的变量列,按照各个变量名的含义,意义对应进行首尾连接。 实现纵向连接的条件:两个待合并的数据文件,其内容合并是有意义的;在不同数据文件中,数据含义相同的列尽量起相同的名字,变量类型与长度也尽量相同。 例7.将transform2.sav中的记录添加到transform.sav中, 注意transform2.sav中的sex对应了transform.sav中的gender。 两个数据文件中匹配好的变量 两个数据文件中未匹配的变量 两个数据文件中匹配好的变量 两个数据文件中未匹配的变量 显示记录来自合并前的哪个文件,0表示来自第一个,2表示来自第二个 其中未选入的变量sex与genger丢失了 * * 文件级别的数据管理 { 简单过程:包括记录排序与拆分、选择与加权记录 变量与数据文件属性向导:用于定义数据字典或将预定义的数据字典直接引入当前文件 数据重构向导:用于进行数据转置 文件合并过程:将几个数据文件合并为一个大的SPSS数据文件 查找重复记录向导: 正交设计过程:用于生产实施联合分析所需的设计,是市场研究中的专用工具,参见《SPSS与市场研究》 一. 记录排序 指将数据编辑窗口中的数据,按照用户指定的某一个或多个变量值的升序或降序重新排序,用户所指定的变量称为排序变量。 单个变量排序:在数据表格的变量名处单击右键 升序 降序 多个变量排序:用Data→Sort Cases 升序或降序可修改 注意: 1. 在多重排序中,先指定的变量名在排序时优先于后指定的变量名,即记录首先按第一个变量进行排序,对于与第一变量取值相同的记录考虑按第二变量排序,依次类推。 2. 排序后,原来记录数据的次序将被打乱,应注意保存原始数据。 二. 记录的拆分 用于将数据文件进行分组,在希望分组进行相应的统计分析或只希望分析其中部分数据时使用 通过Split File来完成 不拆分文件 按所选变量拆分文件,各组分析结果放一起便于比较 按所选变量拆分文件,各组分析结果单独放置 拆分时将数据按所用的拆分变量排序 对数据拆分后,SPSS右下角会出现Split on字样,表示所做的拆分生效,且可以被保存到数据集中,直到再次进行设定为止。 三. 记录筛选 不需要分析全部数据,而是按要求分析部分数据时使用,比如只分析中文是教授的人的年薪等。 通过Select Cases来完成 按某种条件抽样 只分析满足条件的记录 基于时间或记录序号来选择记录 使用筛选指示变量来选择记录 对没选中的记录的处理方式 被隔离,这些记录号上会被加斜杠以示区别,同时自动生成一个名为filter-$的筛选指示变量,被选中的记录该变量取值1,否则0

文档评论(0)

六六书屋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档