CN107436277-CN201710565035-基于相似距离判别的单指标数据质量控制方法.pdfVIP

CN107436277-CN201710565035-基于相似距离判别的单指标数据质量控制方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107436277-CN201710565035-基于相似距离判别的单指标数据质量控制方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 107436277 A (43)申请公布日 2017.12.05 (21)申请号 201710565035.3 (22)申请日 2017.07.12 (71)申请人 广东旭诚科技有限公司 地址 510220 广东省广州市海珠区宝岗大 道137-141号9楼自编A单元 申请人 中山大学 (72)发明人 徐伟嘉 刘永红 冯梦思 黄建彰  卢志想 王家恒  (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 温旭 张泽思 (51)Int.Cl. G01N 15/06(2006.01) G01D 1/14(2006.01) 权利要求书2页 说明书7页 附图1页 (54)发明名称 基于相似距离判别的单指标数据质量控制 方法 (57)摘要 本发明涉及一种基于相似距离判别的单指 标数据质量控制方法,大气环境单个监测指标, 包括:S1.比较每一个站点对应PM2.5与PM10的浓 度大小判断是否为异常检测值,反之进行下一步 计算;S2.按照时间顺序导入检测数据;S3.通过 离群程度P筛选正常值,剩余为疑似异常值;S4. 当S3筛选的疑似异常值在1倍标准差范围内判断 为正常监测,反之确认为疑似异常值;S5.计算S4 确定的疑似异常值的波动程度q,并判断是否为 正常监测,反之再次确认为疑似异常值;S6.计算 S5中疑似异常值所在时刻的各站点的波动性w, A 通过w95%值判断是否异常;S7.S1和S6最终确认 7 的值为异常值。本发明从数据距离、数据波动性、 7 2 6 站点之间的关联性出发判断数据是否存在异常 3 4 7 现象。实现数据自动化审核机制,有效保障数据 0 1 N 质量。 C CN 107436277 A 权 利 要 求 书 1/2页 1.一种基于相似距离判别的单指标数据质量控制方法,其特征在于,所述单指标数据 为大气环境单个监测指标,主要包括以下步骤: S1.基于倒挂的原理比较每一个站点对应PM2.5与PM10的浓度大小,当PM2.5的浓度 PM10的浓度便视为倒挂情况判断为异常检测值,反之进行下一步计算; S2.按照时间序列的格式导入同一个城市不同站点的单个大气环境监测物的检测数 据; S3.依据单个大气环境监测物之间的浓度差值来判断监测物的离群程度P,通过离群程 度P筛选出正常值,剩余为疑似异常值; S4.计算S3筛选的疑似异常值对应时刻各站点检测数据的均值和标准差,当S3筛选的 疑似异常值在1倍均值的标准差范围内判断为正常监测,反之进一步确认为疑似异常值; S5.将S4进一步确认为疑似异常值的数据作为待检测样本,通过波动程度q判断是否为 正常监测,反之再次确认为疑似异常值; S6.计算S5再次确认为疑似异常值所在时刻各站点检测数据的波动性w,通过w 值判 95% 断是否异常; S7.将S1和S6判断为异常的值确认为最终异常值。 2.根据权利要求1所述基于相似距离判别的单指标数据质量控制方法,其特征在于,步 骤S3通过离群程度P筛选出正常值主要包括以下步骤: S21.根据时间序列的格式导入同一个城市不同站点的单个大气环境监测物的检测数 据: S22.计算每一列每个元素与对应列的其他元素之间的距离记为d =∣x -x ∣,d 表

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档