《SPSS数据的管理》PPT课件.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为什么要进行数据管理? 当你想看看有没有错误录入或极端值的时候 (sort cases) 当你想排名次或知道最高分和最低分的时候 (sort cases) 当你的问卷太多,很多人帮你输,你想合成一个文件的时候(merge files) 当你想把前测和后测的数据合并到一起的时候 (merge files) 当你想把数据分成两组或多组分别统计的时候 (split files) 当你只想统计一部分被试资料的时候(select cases) 当你想偷懒的时候(weight cases) Sort cases 排序 升序-Ascending 降序-descending 作用:帮助我们较为直观地看到一组数据的全貌,如学生的名次、最高分、最低分;帮助我们发现输入数据时的错误或极端值。 Merge files 可以合并变量(variable),也可以合并被试(case)。 前者可以把同一批被试的两次会多次测试合而为一;后者可以把几组不同被试的结果合并在一起。 Split files 分割数据 可以把不同组的数据分别统计分析,比如男生女生分别统计。 select cases 选择被试 可以只统计被选的被试的数据,其它忽略不计。 Weight cases 加权数据 对于单个变量中多次重复的数据可以不用逐个录入,只需录入每个数值出现的个数,然后加权即可 练 习 练习数据1和练习数据2是一组被试(编号1-47)分别做两个量表的数据,请把它们合并起来,保存为“量表.sav”。 练习数据3是另一组被试(编号48-65)做着两个量表的数据,请把这些数据加到“量表.sav”里,并保存。 练习数据4是一个班级学生的数学成绩,请分男女排出数学成绩的名次,并粘贴到word文档里。 第四讲 数据的转换(Transform菜单) 为什么要进行数据转换? 当你想对变量进行计算的时候(compute) 计算五门成绩的平均分 计算一个量表各个维度的总分 计算一个人的出生了多少天 计算…… 当你想对某个变量的数据换一种方式表达时(recode) 如果量表中有反向计分的题目需要修正时 如果你想把百分制变成五级计分(优良中及格不及格) 如果你的量表中存在缺失值 …… 更全面的缺失值处理方法(replace missing values) TRANSFORM菜单的几个常用操作 Compute Recode- into same variables Recode -into different variables Replace missing values Compute 计算 Compute里的常见函数 ABS绝对值 SQRT平方根 RND四舍五入取整数 TRUNC截去小数部分取整数 SUM几个变量的和 MEAN几个变量的平均数 SD几个变量的标准差 MAX几个变量的最大值 MIN几个变量的最小值 一些说明 函数是有限的,算式是无穷的 列算式时的一点小技巧——复制、粘贴、查找、替换 Recode重新编码 Recode- into same variables 转换后的数值直接在原变量上覆盖,而不建立新变量。常用于反向计分转换、缺失值处理 Recode -into different variables 转换后的数值保存为另一个新变量。常用于计分方法的转换之类 Replace missing values 1、Series mean:用该变量的所有非缺失值的均数做替代; 2、Mean of nearby points:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义; 3、Median of nearby points:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义; 4、Linear interpolation:用缺失值相邻两点非缺失值的中点值做替代; 5、Linear trend at point:用线性拟合方式确定替代值。 练 习 a1、a5、a30、a43、a49和b2、b6、b19为反向计分,把他们转化为正向。 a1到a25为a量表的第一个维度,a26到a50为第二个维度,b量表只有一个维度,分别求出三个维度的总分(即所有项目得分相加)。 把b量表总分按照从小到大的顺序排列,设置另外一个变量(group),b量表得分前十名赋值“1”,标签为“高分组”,后十名赋值“3”,标签为“低分组”,其它赋值“2”,标签为“中间组”。 各维度总分中如果有缺失,请用该维度的平均分进行替换。 做好的数据另存为“练习完成.sav”。 第三讲 数据的管理(Data菜单) * 计算后的新变量 列算式的地方 函数 计算的条件 第三讲 数据的管理(Data菜单) *

您可能关注的文档

文档评论(0)

yigang0925 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档