- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 SPSS数据的预处理 3.1 数据的排序 3.1.1 数据排序的目的 浏览数据,了解取值状况及缺失值 发现最大最小值,把握离散程度 发现异常值 可分为:单值排序和多重排序 统计知识补充 观测量的排秩 秩的定义 设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成 ,称 的足标i 为 的秩,i = 1,2,Λ,n。 例如:某施行团人员的行李重量数据如表: 重量(kg) 34 39 41 28 33 写出重量33的秩。 因为2833343941,故33的秩为2。 分位数 (一)根据未分组的资料计算四分位数 Q1的位置 =n+1/4 Q2的位置=2(n+1)/4 Q3的位置=3(n+1)/4 式中n表示资料的项数 某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为? 某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数的位置分别为? 根据计算结果可知,Q1、Q2、Q3分别位于向上累计职工人数的第二组、第三组和第四组,月工资四分位数分别为 2.个案重组为变量 练习:SPSS for Windows统计分析(第3版)\data02-13-1.sav;data02-13-2.sav data02-14.sav data02-15.sav 比较数据的转置 特殊情况: 如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。 例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3, 则3个1的秩均为,(2+3+4)/3=3 两个3的秩均为? 自学:秩和检验(Rank sum test) 操作步骤:转换—个案排秩 3.5 分类汇总 练习:以性别和年龄为分类变量,对儿童身高、体重进行汇总求均值(数据:SPSS统计分析从入门到精通\Chapter 03\儿童的身高和体重数据.sav) 3.6 变量值的分组与重新编码 组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。 3.6.2单变量值分组(自动重新分组编码) 转换—自动重新编码 3.6.3组距分组 转换—重新编码为相同变量 转换—重新编码为不同变量 组距分组的步骤 第一步:确定组数。按Sturges提出的经验公式来确定组数 第二步:确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。 第三步:根据分组整理成频数分布表。 例如,某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组 125108112135121 122118118127124 130122123123128 117126127120139 107133134113115 139122133119124 129117126123128 124125123127120 122131118134114 117108110112137 组距=(139-107)÷7=4.6≈5 100 50 合计 610162820128 358141064 105-110110-115115-120120-125125-130130-135135-140 频率(%) 频数(人) 按零件数分组 练习:将跑步测试时间以分钟为单位,组距为2分钟,重新编码。(数据:SPSS统计分析从入门到精通\Chapter 03\跑步机的测试.sav) 可视离散化(分位数分组) 3.7 数据预处理的其他功能 3.7.1 数据转置 数据—转置 3.7.2 加权处理 学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,假如某人期中开始得了84,期末92,作业分91,如果是算数平均,那么就是(84+92+91)/3=89;加权处理后就是84*30%+92*50%+91*20%=89.4 想知道两个班的化学加权平均值,一班50人,平均80,二班60人,平均82,算数平均(80+82)/2=81,加权(50*80+60*82)/(50+60)=81.09 满分10分的情况下,专家打8分,老师打6分,学生打7分,但你认为专家权重和老师及学生权重
文档评论(0)