WSN数据流离群点挖掘研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WSN数据流离群点挖掘研究.doc

WSN数据流离群点挖掘研究   摘要:随着传感器网络技术的发展,WSN中的离群点检测成为近年来研究的热点,出现了很多检测算法。由于传感器节点能量有限,且产生的数据为流式数据,传统、静态的离群数据挖掘方法不再适用。如何在能量消耗最小的情况下,提高检测精度是需要解决的问题。   关键词:无线传感网 离群点检测   中图分类号:TP311.3 文献标识码:A 文章编号:1007-9416(2013)07-0086-01   离群点检测又称异常检测、孤立点检测、偏差检测。Hawkins[1]给出了离群点的本质性定义:离群点是数据集中偏离大部分数据的数据,使人们怀疑这些数据的偏离并非由随机因素产生,而是产生于完全不同的机制。也就是说,离群点是数据集中与其他数据明显不一致的观测值。   离群点检测在传感器网络中有许多重要的应用,例如异常事件检测,动物的行为改变,异常入侵检测等。离群点检测提供了数据可靠性、事件报告和网络安全等功能,在环境监测和濒危物种生活习性监督等领域有着广泛应用。离点群检测是数据挖掘的基本任务之一,与数据挖掘的其他任务一关联规则分析、分类分析、聚类分析等任务相比,离群点检测更加符合数据挖掘的本质。   随着传感器网络技术的发展,WSN中的离群点检测成为近年来研究的热点,出现了很多检测算法。由于网络有限的资源,传感器网络中的数据挖掘技术受到了很多的限制,使得其离群点检测面临严峻的挑战[2],最棘手的问题是如何在能量消耗最小的情况下,提高检测精度。   由于受到网络通信带宽有限、物理设备故障、恶劣环境及外界干扰等因素影响,传感器网络中节点收集的数据往往是不可靠不精确的,数据会出现异常、丢失、不一致等问题。在WSN中,离群点定义为那些明显偏离传感数据正常模式的数据[3]。在WSN中传感器节点用于监测物理世界,因此存在着代表正常行为和状态的传感数据模式。   由于WSN特殊的特点,如资源受限,物理故障,及恶劣的环境影响等,无线传感器网络更容易产生异常值。很多课题研究如何在WSN中识别离群点原因的问题,包括错误检测,事件检测以及入侵检测。这一方向的研究值得深入探讨,以获得对决策有帮助的信息,而不是单纯地将离群点作为错误信息忽略掉。   在许多研究中,为了减少不一致数据也就是离群数据对分析结果的影响,离群点常常被忽略或者作为噪声被处理,然而,“一个人的噪声可能是另一个人的信号”,不加分析地舍弃离群数据,可能导致重要信息的丢失[4]。例如在欺诈检测中,离群数据可能意味着欺诈行为的发生;在环境监测中,离群数据可能预示着灾害天气的到来;在入侵检测中,离群数据可能意味着入侵行为的发生等等,由此可见离群数据检测是数掘挖掘领域的一项关键任务。如果可能,噪音和错误数据应该被忽略或纠正,因为噪音是随机的错误,不会对实际数据分析造成影响。而造成离群的其他原因应该识别出来,因为其中可能隐含研究者感兴趣的关于事件的重要信息。   要将现有的离群点检测技术应用到传感器网络中,存在的主要问题有[5-8]:   (1)大多数现有工作没有考虑多变量数,假设传感数据是单变量的。然而,有时候单个变量没有出现异常,但多个变量一起考虑时可能就是异常状况。   (2)现有技术考虑邻居节点之间的空间关联,但如何选择合适的邻居范围是一个问题。而考虑数据事件关联性的时候,如何选择滑动窗口的大小也是个问题。   (3)很少区别离群点究竟是事件还是错误。现有方法只是简单将离群点认为是错误。通常认为错误应该被删除,关于隐藏事件的重要的信息有可能丢失。实际上这些技术没有具体描述如何处理识别出来的离群点。   (4)许多技术需要用户定义阈值,但我们往往难以定义一个合适的阈值。此外,如果WSN特征动态变化的话,设置固定的阈值也是不合理的。   (5)这些技术假设传感节点是静止的,没有考虑节点移动性。如果将这些算法应用到动态网络环境中也存在一些问题。   参考文献   [1]Hawkins D.Identification of Outliers[M].London:Chapman and Hall,1980.   [2]Zhang Y.Meratnia N.,Havinga P.Outlier Detection Techniques for Wireless Sensor Network:A Survey[J].IEEE COMMUNICATIONS SURVEYS TUTORIALS,2010,12(2):1—12   [3]Chandola, V., Banerjee, A. and Kumar, V. (2007) Outlier detection: a survey, Technical Report, University of Minn

文档评论(0)

lmother_lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档