用格拉布斯准则判断异常数据.pdf

用格拉布斯准则判断异常数据 一、实验目的 1.通过实验加深对格拉布斯准则的理解。 2 .掌握实验中异常数据的处理方法。 二、实验要求 用 C 语言或其它高级语言编写一程序,输入一组测量数据( 9~ 15 个,程序 可设定),根据格拉布斯准则判断有无异常数据。如有,则剔除异常数据并重新 计算,直到无异常数据为止。具体要求如下 : 1. 数据个数可输入; 2. 格拉布斯系数 g 以表的形式存于数组中; 3. 显示均值、标准偏差等中间结果、被剔除的异常数据、显示无异常数据 的测量数据等。 三、实验原理 在无系统误差的情况下, 测量中大误差出现的概率是很小的。 在正态分布下, 误差绝对值超过 2.57 的概率仅为 1%,误差绝对值超过 3 的概率仅为 0.27%≈1/370。对于误差绝对值较大的测量数据,就值得怀疑,可以列为可疑数 据。可疑数据对测量值的平均值及实验标准偏差都有较大的影响, 造成测量结果 的不正确, 因此在这种情况下要分清可疑数据是由于测量仪器、 测量方法或人为 错误等因素造成的异常数据, 还是由于正常的大误差出现的可能性。 首先,要对 测时过程进行分析, 是否有外界干扰, 如电力网电压的突然跳动, 是否有人为错 误,如小数点读错等。其次,可以在等精度条件下增加测量次数,以减少个别离 散数据对最终统计估值的影响。 在不明原因的情况下, 就应该根据统计学的方法来判别可疑数据是否是粗差。 这种方法的基本思想是: 给定一置信概率, 确定相应的置信区间, 凡超过置信区 间的误差就认为是粗差, 并予以剔除。 用于粗差剔除的常见方法有莱特检验方法 和格拉布斯检验方法。 1. 莱特检验方法 莱特检验法是一种正态分布情况下判别异常值的方法。判别方法如下: 假设在一列等精度测量结果中,第 i 项测量值 xi 所对应的残差 vi 的绝对值 ,则该误差为粗差,所对应的测量值 xi 为异常数值,应剔除不用。 此处,残差 ,标准偏差估计 ( 贝塞尔公式 ) ,均值 。 本检验方法简单,使用方便,当测量次数 n 较大时,是比较好的方法。一般 适用于 n10 的情况, n10 时,莱特检验法失去判别能力。 2. 格拉布斯检验法 格拉布斯检验法是在未知总体标准偏差 的情况下,对正态样本或接近正 态样本异常值进行判别的一种方法,是一种从理论上就很严密,概率意义明确, 以经实验证明效果较好的判据。 具体方法如下: 对一系列重复测量中的最大或最 小数据,用格拉布斯检验法检验,若残差 ,则判断此值为异常数 据,应予以剔除。 g 值按重复测量次数及置信概率由表 2-1 给出。 表 2-1 格拉布斯检验法 g 值 n 1- pc 3 4 5 6 7 8 9 10 11 12 5% 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.29 1% 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48

文档评论(0)

1亿VIP精品文档

相关文档