基于Voronoi和信息熵的空问离群样点检测.pdfVIP

基于Voronoi和信息熵的空问离群样点检测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3998 2010,31(18) 计算机工程与设计 ComputerEngineeringandDesign ·软件与算法 · 基于Voronoi和信息熵的空问离群样点检测 王 妍 , 潘瑜春 H, 王 慧 (1.国家农业信息化工程技术研究中心,北京 100097;2.首都师范大学信息工程学院,北京 100037; 3.北京科络捷通讯产品有限责任公司,北京 100043) 摘 要:为了提高离群点挖掘的效率和准确度 ,在分析了传统离群点挖掘算法优、缺点的基础上,提出一种离群点检测算 法。该算法利用Voronoi确定样点之 间的邻近关系,通过参照邻域范围内其它样点的非空间属性值的信息熵作为离群 因子, 并根据离群因子标识出样点集中的离群点。以北京市大兴区土壤养分为例,实验结果表明,该检测算法能够高效、准确地检 测出土壤样点中的离群点。 关键词:空间离群点;离群点检测;泰森多边形;信息熵;离散化 中图法分类号:TP3l1 文献标识码:A 文章编号:1000.7024(2010)18-3998.03 Basedonvoronoiandinformationentropyspatialoutliersdetectionalgorithms WANGYan , PAN Yu—chunH, WANGHui (1.NationalEngineeringResearchCenterforInformationTechnologyinAgriculture,Beijing100097,China; 2.InstituteofInformationEngineering,CapitalNormalUniversity,Beijing100037,China; 3.BeijingCoreLogicCommunicationCoLtd,Beijing100043,China) Abstract:Inordertoenhancetheoutliermmmgefficiencyandaccuracy, soiloutliersdetectionalgorithm basedonVoronoiandinfor- marionenrtopyisproposedafteranalyzingtheadvantagesanddisadvantagesoftheclassicaloutlierminingalgorithmsatfirst.Thealgo· rithm calculatesinformationen~opyofnon-spatialattributeastheoutlierfactorbyVoronoineighborhoodwithoutparameters.Taking soilnutrientinDaxingdistrictasanexample,experimentalresultsshowthattheproposedalgorithm outperfomr sotherexistingalgorithms indetectionaccuracy,userdependencyandefficiency. Keywords:spatialoutliers;outlierdetection;Voronoi; informationentropy;discretization 定的不便并增大了算法的复杂度。鉴于此,曲吉林提出了基 O 引 言 于Voronoi图的异常检测算法 ,由于邻域确定是决定离群点 空间离群点是指根据其空间位置和空间关系确定空间邻 检测算法时间复杂度的关键步骤,在该算法中通过Voronoi图 域内,与其邻居样点在非空间属性上有 明显不 同的空间对象; 来确定待检测对象的邻域,这样做就避免了输入参数k的所 而且它们是局部离群的。空间离群点检测在交通、气象以及 带来的麻烦,最终导致算法的时间复杂度从O(dN)降低到O 基于空间位置的服务等很多方面有着非常广泛的应用。 (NlogN)。然而该算法的缺陷是

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档