- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
测量数据在其采集与传输过程中,由于环境干扰或人为因素有可能造成个别数据不切合实际或丢失,这种数据称为异常值。为了恢复数据的客观真实性以便将来得到更好的分析结果,有必要先对原始数
据(1)剔除异常值;
另外,无论是人工观测的数据还是由数据采集系统获取的数据,都不可避免叠加上“噪声”干扰(反映在曲线图形上就是一些“毛刺和尖峰”)。为了提高数据的质量,必须对数据进行(2)平滑处理(去
噪声干扰);
(一)剔除异常值。
注:若是有空缺值,或导入Matlab数据显示为“NaN”(非数),需要①忽略整条空缺值数据,或者②填上空缺值。
填空缺值的方法,通常有两种:A. 使用样本平均值填充;B. 使用判定树或贝叶斯分类等方法推导最可能的值填充(略)。
一、基本思想:
规定一个置信水平,确定一个置信限度,凡是超过该限度的误差,就认为它是异常值,从而予以剔除。
二、常用方法:拉依达方法、肖维勒方法、一阶差分法。注意:这些方法都是假设数据依正态分布为前提的。
拉依达方法(非等置信概率)
如果某测量值与平均值之差大于标准偏差的三倍,则予以剔除。
1
1 n ? 1 n ?2
其中,x? ? x为样本均值,S ?? ? (x?x)2? 为样本的标准偏
ix
i
n i
i?1
?n?1i?1 ?
差。
注:适合大样本数据,建议测量次数≥50次。代码实例(略)。
肖维勒方法(等置信概率)
在n次测量结果中,如果某误差可能出现的次数小于半次时,
就予以剔除。
这实质上是规定了置信概率为1-1/2n,根据这一置信概率,可计算出肖维勒系数,也可从表中查出,当要求不很严格时,还可按下列
nn近似公式计算:Tab1.
n
n
n
3
4
5
6
7
8
9
10
11
12
ω
1.38
1.53
1.65
1.73
1.80
1.86
1.92
1.96
2.00
2.03
n
13
14
15
20
30
40
50
100
200
500
ω
2.07
2.10
2.13
2.24
2.39
2.49
2.58
2.81
3.02
3.20
如果某测量值与平均值之差的绝对值大于标准偏差与肖维勒系数之积,则该测量值被剔除。
例1.利用肖维勒方法对下列数据的异常值(2.5000)进行剔除:1.5034 1.5062 1.5034 1.5024 1.4985 2.5000 1.5007
1.5067 1.4993 1.4969
上述数据保存于文件erro.dat
代码:
x=load(error.dat);n=length(x);
subplot(2,1,1);
plot(x,o);
title(原始数据)
axis([0,n+1,min(x)-1,max(x)+1]);w=1+0.4*log(n);
yichang=abs(x-mean(x))w*std(x);
%若用拉依达方法,把w改成3即可,但本组数据将不能成功剔除异常值。
x(yichang)=[];
saveerrornew.datx-ASCIIsubplot(2,1,2);
plot(x,rs);title(异常值剔除后数据);
axis([0,n+1,min(x)-1,max(x)+1]);
运行结果:x=
1.5034
1.5062
1.5034
1.5024
1.4985
2.5000
1.5007
1.5067
1.4993
1.4969
y=
1.5034
1.5062
1.5034
1.5024
1.4985
1.5007
1.5067
1.4993
1.4969
一阶差分法(预估比较法)
用前两个测量值来预估新的测量值,然后用预估值与实际测量值比较,若大于事先给定的允许差限值,则剔除该测量值。
预估值比较判别:
注:该方法的特点是
(1)适合于实时数据采集与处理过程;
精度除了与允许误差限的大小有关外,还与前两点测量值的
精确度有关;
若被测物理量的变化规律不是单调递增或单调递减函数,这一方法将在函数的拐点处产生较大的误差,严重时将无法使用。
(二)数据的平滑处理
对于一组测量数据(xi,yi)i=1,…,n,不要直接就想着求出的拟合多项式的线性参数,而是要先平滑处理去掉“噪声”。平滑处理在科学研究中广泛使用,它可以减少测量中统计误差带来的影响,尤其被用于无法利用多次重复测量来得到其平均值的情况和当yi随xi
有徒然变化的那些测量段。
“(2n+1点)单纯移动平均”平滑滤波
取出以yi为中心的前后各n个数据(yi-n,…,yi-1,yi,…yi+n)求平均值代替yi,即
优点:方法简单,计算方便。
缺点:方法产生误差会造成信号失真;前后各n个数据无法平滑。适用性:适用于变化缓慢的数
您可能关注的文档
最近下载
- 征信详细版纸质个人信用报告2024年12月最新版可编辑带水印模板.pdf
- ANSI ESD STM11.13-2021两点电阻测量.pdf VIP
- AQ 1023-2006煤矿井下低压供电系统及装备通用安全技术要求.pdf VIP
- 2025至2030中国口腔喷雾剂行业发展研究与产业战略规划分析评估报告.docx VIP
- 那智不二越机器人操作说明.pdf VIP
- 2025年安徽省医疗系统招聘考试《临床专业知识》必考题库(答案+解析)【1000题】_1.docx
- 会计工作心得体会版7篇.docx VIP
- 4.12+中国共产党诞生 统编版八年级历史上册.pptx VIP
- 中国前庭诱发肌源性电位检测临床实践专家共识(2024).pptx VIP
- 专题06 《穿井得一人》 (真题+模拟专练)-备战2024年中考语文·课内39篇文言文阅读(解析版).pdf VIP
原创力文档


文档评论(0)