SPSS数据预处理指导.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 SPSS数据的预处理 3.1 数据的排序 3.1.1 数据排序的目的 浏览数据,了解取值状况及缺失值 发现最大最小值,把握离散程度 发现异常值 可分为:单值排序和多重排序 统计知识补充 观测量的排秩 秩的定义 设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成 ,称 的足标i 为 的秩,i = 1,2,Λ,n。 例如:某施行团人员的行李重量数据如表: 重量(kg) 34 39 41 28 33 写出重量33的秩。 因为2833343941,故33的秩为2。 分位数 (一)根据未分组的资料计算四分位数 Q1的位置 =n+1/4 Q2的位置=2(n+1)/4 Q3的位置=3(n+1)/4 式中n表示资料的项数 某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为? 某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数的位置分别为? 根据计算结果可知,Q1、Q2、Q3分别位于向上累计职工人数的第二组、第三组和第四组,月工资四分位数分别为 2.个案重组为变量 练习:SPSS for Windows统计分析(第3版)\data02-13-1.sav;data02-13-2.sav data02-14.sav data02-15.sav 比较数据的转置 特殊情况: 如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。 例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3, 则3个1的秩均为,(2+3+4)/3=3 两个3的秩均为? 自学:秩和检验(Rank sum test) 操作步骤:转换—个案排秩 3.5 分类汇总 练习:以性别和年龄为分类变量,对儿童身高、体重进行汇总求均值(数据:SPSS统计分析从入门到精通\Chapter 03\儿童的身高和体重数据.sav) 3.6 变量值的分组与重新编码 组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。 3.6.2单变量值分组(自动重新分组编码) 转换—自动重新编码 3.6.3组距分组 转换—重新编码为相同变量 转换—重新编码为不同变量 组距分组的步骤  第一步:确定组数。按Sturges提出的经验公式来确定组数 第二步:确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。 第三步:根据分组整理成频数分布表。 例如,某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组 125 108 112 135 121 122 118 118 127 124 130 122 123 123 128 117 126 127 120 139 107 133 134 113 115 139 122 133 119 124 129 117 126 123 128 124 125 123 127 120 122 131 118 134 114 117 108 110 112 137 组距=(139-107)÷7=4.6≈5 100 50 合计 6 10 16 28 20 12 8 3 5 8 14 10 6 4 105-110 110-115 115-120 120-125 125-130 130-135 135-140 频率(%) 频数(人) 按零件数分组 练习:将跑步测试时间以分钟为单位,组距为2分钟,重新编码。(数据:SPSS统计分析从入门到精通\Chapter 03\跑步机的测试.sav) 可视离散化(分位数分组) 3.7 数据预处理的其他功能 3.7.1 数据转置 数据—转置 3.7.2 加权处理 学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,假如某人期中开始得了84,期末92,作业分91,如果是算数平均,那么就是(84+92+91)/3=89;加权处理后就是84*30%+92*50%+91*20%=89.4 想知道两个班的化学加权平均值,一班50人,平均80,二班60人,平均82,算数平均(80+82)/2=81,加权(50*80+60*82)/(50+60)=81.09 满分10分的情况下,专家打8分,老师打6分,学生打7分,但你认为专家权重和老师及学生权重

文档评论(0)

beautyeve + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档