- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录
摘要 错误!未定义书签。
关键词 错误!未定义书签。
引言 错误!未定义书签。
异常值的判别方法 错误!未定义书签。
检验(3S)准则 错. 误!未定义书签。
狄克松(Dixon)准则 错. 误!未定义书签。
格拉布斯(Grubbs)准则 错误!未定义书签。
指数分布时异常值检验 错. 误!未定义书签。
莱茵达准则(PanTa) 错. 误!未定义书签。
肖维勒准则(Chauvenet) 错误!未定义书签。
实验异常数据的处理 错误!未定义书签。
结束语 错误!未定义书签。
参考文献 错误!未定义书签。
试验数据异常值的检验及剔除方法
摘要:在实验中不可避免会存在一些异常数据,而异常数据的存在会
掩盖研究对象的变化规律和对分析结果产生重要的影响,异常值的检验与正确处理是保证原始数据可靠性、平均值与标准差计算准确性的前提.本文简述判别测量值异常的几种统计学方法,并利用DPS 软件检验及剔除实验数据中异常值,此方法简单、直观、快捷,适合实验者用于实验的数据处理和分析.
关键词:异常值检验;异常值剔除;DPS;测量数据
引言
在实验中,由于测量产生误差,从而导致个别数据出现异常,往往导致结果产生较大的误差,即出现数据的异常.而异常数据的出现会掩盖实验数据的变化规律,以致使研究对象变化规律异常,得出错误结论.因此,正确分析并剔除异常值有助于提高实验精度.
判别实验数据中异常值的步骤是先要检验和分析原始数据的记录、操作方法、实验条件等过程,找出异常值出现的原因并予以剔除.
利用计算机剔除异常值的方法许多专家做了详细的文献 [1报] 告.如王鑫,吴
先球,用 Origin 剔除线形拟合中实验数据的异常值;严昌顺.用计算机快速剔除含粗大误差的“环值”;运用了统计学中各种判别异常值的准则,各种准则的优劣程度将体现在下文.
异常值的判别方法
判别异常值的准则很多,常用的有t 检验(3S)准则、狄克松(Dixon)准则、格拉布斯(Grubbs)准则等准则.下面将一一简要介绍.
检验(3S)准则
t 检验准则又称罗曼诺夫斯基准则,它是按t 分布的实际误差分布范围来判别异常值,对重复测量次数较少的情况比较合理.
基本思想:首先剔除一个可疑值,然后安t 分布来检验被剔除的值是否为异常值.
设样本数据为 x , x , x x
1 2 3 n
,若认 x
j
为可疑值.计算余下 n ?1 个数据平均值
x n?1
及标准差s
n?1
,即 x
n?1
? 1
n ?1
?n
i?1,i? j
x , s ? )2
n ?
n ? 2
1 ?n
(x ? x
i n?1
i?1,i ? j
.
然后,按t 分布来判别被剔除的值 x
j
是否为异常值.
若x j ? xn?1 ? kn( , a) ,则 x j 为异常值,应予剔除,否则为正常值,应予以保留.其中: a 为显著水平; n 数据个数; k (n, a) 为检验系数,可通过查表得到.
狄克松(Dixon)准则
设有一组测量数据 x ? x ? x ? x
,且为正态分布,则可能为异常值的测
1 2 3 n
量数据必然出现在两端,即 x 或 x .
1 n
狄克松给出了不同样本数量n 时检验统计量的计算公式(见表 1).当显著
水平a 为 1%或 5%时,狄克松给出了其临界值 D
1?a (n)
.如果测量数据的检验统计量
D ? D ,则 x 为异常值,如果测量数据的检验统计量 D ? D
,则 x 为异
1?a (n) 1
常值.
表 1 狄克松检验统计量计算公式为
1?a (n) n
统计量
统计量 D
数据个数n
x 为可疑值 D
1
x 为可疑值 D
n
3 ? n ? 7
(x ? x ) / (x ? x )
2 1 n 1
(x ? x ) / (x ? x )
n n?1 n 1
8 ? n ? 10
(x ? x ) / (x
2 1 n?1 1
x )
(x ? x ) / (x ? x )
n n?1 n 2
11 ? n ? 13
(x ? x ) / (x
3 1 n?1 1
x )
(x ? x
n n?2 n 2
) / (x ? x )
14 ? n ? 30
(x ? x ) / (x
3 1 n?2 1
x )
(x ? x
n n?2 n 3
) / (x ? x )
格拉布斯(Grubbs)准则
设有一组测量数据为正态分布,为了检验数据中是否存在异常值,将其按
大小顺序排列,即 x ? x ? x ? x
,可能为异常值的测量数据一定出现在最大
1 2 3 n
或最小的数据中.
若最小值 x 是可疑的,则检验统计量 G ? (x ? x ) / s .式中 x 是均值、 s 是标
1 1
准差,即
文档评论(0)