第4章文件级别的数据管理.ppt

下载文档

34
0
约2.59千字
约 17页
2019-07-14 发布于广东
举报
版权申诉
保障服务

第4章文件级别的数据管理.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第4章文件级别的数据管理 2013.10 “数据”菜单中的项目：简单命令：插入变量、插入个案、到达某条个案、复制数据集等。常用的简单过程：排序个案、分割文件、选择个案、个案加权和分类汇总。数据重组向导：长型和宽型格式数据互换文件合并向导：添加个案与添加变量与数据字典有关的功能:定义变量属性与复制数据属性与数据准备有关的功能：重复个案与异常个案查找向导与统计模型密切相关的过程其他过程：定义多重响应集 4.1 几个常用过程 4.1.1 排序个案 “排序个案”（ Sort Cases）排序个案是将数据按照指定的某一个或多个变量值的升序或降序重新排列；排序变量：用户指定的变量；对所有记录进行排序；对记录进行分组排序，如分性别排序；单变量排序和多变量排序；多变量优先排序；同时设置升序、降序；原数据排列次序变化问题。 4.1.2 分割文件 “拆分文件” （ Split File ）；分割文件是将数据文件分组进行处理，可通过拆分数据集实现；数据集拆分后，状态栏显示“拆分文件time”（Split On）；取消拆分。 4.1.3 选择个案 “选择个案”（ Select Cases）选择个案是对部分数据进行分析；选择后状态栏显示“筛选范围”（Filter On）取消选择。 4.1.4 加权个案 “加权个案”（ Weight Cases ）枚举格式和频数格式；权重变量选择后状态栏显示“加权范围”（ Weight On）取消加权。 4.1.5 分类汇总 “分类汇总”（ Aggregate）分类汇总是按照指定的分类变量对观测值进行分组，求出指定的描述统计量，结果可存入新数据文件，也可替换当前数据文件；分类汇总三步骤：指定分类变量和汇总变量；分类并计算；结果保存；分类汇总产生的记录数和多重分类汇总。例4.1 按time月份和s0城市对index1进行分类汇总，并将结果保存到新数据文件Sum_index1中。又例根据数据transform.sav 中学生的性别和城市变量对英语的平均成绩进行汇总。 4.2 数据文件的重组与转置 4.2.1 数据的长型与宽型格式长型格式与宽型格式是重复测量数据的两种不同的排列方式，重复测量数据可以使用不同的统计模型（重复测量模型）分析，数据的转换就是必要的。 “重组”（Restructure）; 以SPSS的自带文件Anxiety.sav和Anxiety2.sav为例。 4.2.2 长型格式转换为宽型格式使用“数据重构向导”；个案重组为变量；例4.2 将Anxiety.sav转换为Anxiety2.sav的格式。 4.2.3 宽型格式转换为长型格式使用“数据重构向导”；变量重组为个案；例将Anxiety2.sav 转换为Anxiety.sav的格式。 4.2.4 数据转置数据转置功能实现的两个途径：“转置”（Transpose）;“数据重构向导”的第三个功能；对数据进行行列互换，即将记录转为变量，将变量转为记录，数据重新显示。以数据xuelin.sav为例。 4.3 多个数据文件的合并 “合并文件” （Merge File）添加个案和添加变量 4.3.1 基本概念：纵向拼接和横向合并;案例文件解释 4.3.2 数据文件的纵向拼接数据文件的纵向拼接是“添加个案”；例4.3 将数据b.sav中的记录添加到a.sav中，注意变量h-height 又例将数据transform2.sav中的记录添加到transform.sav中。 4.3.3 数据文件的横向合并数据文件的横向合并是“添加变量”；例4.4 将数据c.sav中的变量添加到a.sav中，并尽量保留数据。例3.9 将数据transform3.sav中的记录添加到transform.sav中。数据文件横向合并的三个条件：在两个数据文件中选择公共变量作为关键变量，关键变量可以多个；两个数据文件按关键变量升序排序；在不同数据文件中，数据含义不同的列，变量名应不同。 4.4 与数据字典有关的功能 4.4.1 数据字典的基本概念数据字典是预先定义好的数据格式，包括变量格式、变量名标签、变量值标签、缺失值的定义；两个数据管理向导：专门用于定义数据字典，或将预定义的数据字典直接引入当前数据文件。 4.4.2 定义变量属性 “定义变量属性”（Define Variable Properties）；用于对数据集中已存在的变量进一步定义其属性：列出所选变量的所有取值；分辨没有值标签的值；自动给出值标签；所选变量与其他变量的属性相互拷贝；与变量视图的区别。