- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用标准文档
09. 缺失值处理
空缺值(用“ .”表示)和输入错误值,都属于缺失值范畴。
输入错误值需要做“数据检验”来发现:
(1)【分析】——【描述统计】——【描述】和【频率】
(2 )【图形】——【旧对话框】——【箱图】
观察极小、极大值、频率、异常值等来判断。例如,性别“男 =1,女
=2”,若极大值出现 3,则是输入错误值;箱线图或 3 σ原则发现的异
常值,则要先改成缺失值。
缺失值的处理方法通常有四种。
一、删除有缺失值的个案
删除有缺失值的个案,或在具体统计分析时的【选项】——【缺
失值】框选择某种处理方法:
文案大全
实用标准文档
①按列表排除个案——只要任何一个变量含有缺失值, 就要剔除
出所有因变量或分组变量中有缺失值的观测记录;
②按对排除个案——同时剔除带缺失值的观测量及与缺失值有
成对关系的观测量(对照分析) ;
③使用均值替换——使用该变量的均值替换缺失值。
二、替换缺失值
SPSS提供了 5 种简单替换缺失值的方法:
(1)序列均值——该变量的有效观察值的平均数;
(2 )临近点的均值——该缺失值前后 n 个观察值的平均数;
(3 )临近点的中位数——该缺失值前后 n 个观察值的中位数;
(4 )线性插值——该缺失值前后观察值建立插值直线确定【同
取 n=1 的(2 )】;
(5 )点处的线性趋势——以编号为自变量用线性回归法预测值。
现有数据文件:
文案大全
实用标准文档
1. 【转换】——【替换缺失值】 ,打开“替换缺失值”窗口,将
变量“统计成绩”选入【新变量】框;
2. 【名称和方法】框,设定新变量名称“统计成绩 _1 ”,方法选
“序列均值”
3.点【确定】,得到
注意:若某个案的缺失值较多最好删除该个案, 而不是替换其缺
失值。
文案大全
实用标准文档
三、缺失值分析
SPSS中更高级的处理缺失值的方法是缺失值分析,它能够
(1)缺失值的描述和快速诊断:
用灵活的诊断报告来评估缺失值问题的严重性, 用户可以观察到
它们在哪些变量中出现,比例是多少,是否与其它变量取值有关,从
而得知这些缺失值出现是否会影响分析结论。
(2 )得到更精确的统计量:
提供了多种方法用于估计含缺失值数据的均值、 相关矩阵或协方
差矩阵,通过这些方法计算出的统计量更加可靠。
(3 )用估计值替换缺失值:
使用 EM 或回归法, 用户可以从未缺失数据的分布情况中推算出
缺失数据的估计值, 从而能有效地使用所有数据进行分析, 来提高统
计结果的可信度。
【缺失值分析】实例操作,使用 SPSS 20自带的实例文件:
telco_missing.sav
文案大全
实用标准文档
1. 【分析】——【缺失值分析】 ,打开“缺失值分析”窗口,将
变量“婚姻状况、教育程度、退休、性别”选入【分类变量】 ,将变
量“服务月数、年龄、现在住址居住年数、家庭收入、现职位工作年
数、家庭人数”选入【定量变量】
注意:最大类别(最大分类数)默认为 25 ,超过该数目的分类
变量将不引入分析。
原创力文档


文档评论(0)