利用SPSS190剔除异常值.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用SPSS190剔除异常值

如何利用SPSS 19.0剔除数据中的异常值 (Outliers) 一般数组应遵循正态分布,但一列数组中有可能会出现异常值,从而影响数据的方差和统计结果,因此挡在SPSS中输入数据后,首先要检查数据中是否存在异常值。方法如下: 选择想要观察的数据,此处我们选择normal 列中的数据进行查看 进入菜单栏中“分析”→“描述统计”→“探索” 将“normal”数组放入因变量列表中 点击“探索”窗口中的“统计量”,点掉“描述性”,选择“界外值”和“百分位数” 点击“探索”窗口中“绘制”,选择“直方图”,去掉“茎叶图” 选择结束后点击“探索”窗口“确定”查看结果: 百分位数图: 百分位数百分位数5102550759095加权平均(定义 1)normal16.817216.817217.839619.381026.028129.303929.3039Tukey 的枢纽normal18.278419.381023.8990 以50%左右两个百分位数(即四分位数25和75下方的加权平均值)的加权平均值计算最高和最低临界值,使用计算公式如下: Upper=Q3+(2.2*(Q3-Q1)) Lower=Q1-(2.2*(Q3-Q1)) 此处Q3=26.0281, Q1=17.8396 计算后,Upper=44.0428,Lower=-0.1751 查看“极值”表格: 极值案例号值normal最高12029.3022229.3032429.3044629.3054729.30a最低18116.8227816.8237516.8245716.8255416.82ba. 上限值表中仅显示一部分具有值 29.30 的案例。 b. 下限值表中仅显示一部分具有值 16.82 的案例。 如果有最高值查过Upper,或最低值小于Lower值,则被视为Outliers, 即异常值。由图中看,此列数组并无异常值

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档