- 11
- 0
- 约1.19万字
- 约 16页
- 2021-11-20 发布于上海
- 举报
实用标准文案
012. 数据预处理( 1 )——剔除异常值及平滑处理
测量数据在其采集与传输过程中, 由于环境干扰或人为因素有可
能造成个别数据不切合实际或丢失, 这种数据称为异常值。 为了恢复
数据的客观真实性以便将来得到更好的分析结果, 有必要先对原始数
据( 1)剔除异常值;
另外,无论是人工观测的数据还是由数据采集系统获取的数据,
都不可避免叠加上“噪声”干扰(反映在曲线图形上就是一些“毛刺
和尖峰”)。为了提高数据的质量, 必须对数据进行 (2)平滑处理 (去
噪声干扰);
(一)剔除异常值。
注:若是有空缺值,或导入 Matlab 数据显示为“ NaN”(非数),
需要①忽略整条空缺值数据,或者②填上空缺值。
填空缺值的方法,通常有两种: A. 使用样本平均值填充; B. 使
用判定树或贝叶斯分类等方法推导最可能的值填充(略) 。
一、基本思想:
规定一个置信水平, 确定一个置信限度, 凡是超过该限度的误差,
就认为它是异常值,从而予以剔除。
文档大全
实用标准文案
二、常用方法:拉依达方法、肖维勒方法、一阶差分法。
注意:这些方法都是假设数据依正态分布为前提的。
1. 拉依达方法(非等置信概率)
如果某测量值与平均值之差大于标准偏差的三倍, 则予以剔除。
x x 3S
i x
1
1 n 1 n 2 2
其中, x xi 为样本均值, Sx (xi x ) 为样本的标准偏
n i 1 n 1 i 1
差。
注:适合大样本数据,建议测量次数≥ 50 次。
代码实例(略)。
2. 肖维勒方法(等置信概率)
在 n 次测量结果中,如果某误差可能出现的次数小于半次时,
就予以剔除。
这实质上是规定了置信概率为 1-1/2n ,根据这一置信概率, 可计
算出肖维勒系数,也可从表中查出,当要求不很严格时,还可按下列
近似公式计算:
文档大全
实用标准文案
n 1 0.4ln( n)
Tab1. 肖维勒系数表
n 3 4 5 6 7 8 9 10 11 12
ω 1.38 1.53 1.65 1.73 1.80 1.86 1.92 1.96 2.00 2.03
n
n 13 14 15 20 30 40 50 100 200 500
ω 2.07 2.10 2.13 2.24 2.39 2.49 2.58 2.81 3.02 3.20
n
如果某测量值与平均值之差的绝对值大于标准偏差与肖维勒系
数之积,则该测量值被剔除。
x x S
i
您可能关注的文档
- Logistic回归模型介绍.pdf
- logo设计理念1分析和总结.pdf
- logo设计说明怎么写.pdf
- look,see,watch的区别及练习_优选..pdf
- LoRa智能电表安全用电管理方案计划系统.pdf
- LoRa智能路灯方案设计.pdf
- LPG-CNG-LNG机动车罐车事故处置图册.pdf
- LPG基本知识分析和总结.pdf
- LSI3008、9361Raid配置分析和总结.pdf
- LTE的掉话原因分析及管理组织思路(加精,值得收藏).pdf
- 初中一年级数学下册:全等三角形测距原理的探究与工程实践教案.docx
- 高考物理 08讲 动量与动量守恒定律在电磁感应中的应用之专题强化原卷版.docx
- 高考物理 01讲 力与物体的平衡专题强化训练原卷版.docx
- 人教版初中英语七年级下册 Unit 2 What time do you go to school Section A (1a1d) 精品教案.docx
- 高考物理 09讲 带电粒子在电场中的运动解析版.docx
- 小学六年级数学《鸡兔同笼》思想方法全景复习知识清单.docx
- 春季健康守护:远离疾病,拥抱健康.pptx
- 广西来宾市2025-2026学年高二上学期9月月考物理试题(解析版).docx
- 2026届新高考语文三轮热点复习:冬奥人物谷爱凌、徐梦桃、苏翊鸣素材.pptx
- 春季流感传播路径与预防课件PPT.pptx
最近下载
- 员工奖金保密协议9篇.docx VIP
- 2025年东莞市东华初级中学中考数学模拟试卷附答案解析.pdf
- 2026年河南质量工程职业学院单招职业适应性测试备考题库及答案解析.docx VIP
- 2024年河南质量工程职业学院单招职业适应性测试试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库有答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性考试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库及答案解析.docx VIP
- 6.1《北方地区自然特征与农业》课件-2023-2024学年人教版地理八年级下册.pptx VIP
- 2025年高考英语全国卷Ⅰ续写分析与教学策略.pptx VIP
原创力文档

文档评论(0)