- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【论文】一种基于数学形态学的离群点检测算法
硕士研究生学位论文
题目 一种基于数学形态学的离群点检测算法
An Outlier Detection Algorithm Based on Mathematical Morphology
摘要
数据挖掘是在海量的数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法。在信息爆炸的今天,数据挖掘显得尤为重要。
一个人的噪声可能是另一个人的信号,忽视或降低离群点的存在性都将可能导致重要隐藏信息的丢失。在一些从数据库中发现知识 (KDD)的应用实践中,发掘特别的实例,不具备一般数据特性的数据对象或离群点比找出普通模式更加令人感兴趣。因此,离群点本身可能是非常重要的,例如在欺诈探测中,离群点可能预示着欺诈行为。总之,离群点检测是数据挖掘领域一个重要的研究方向。
本文在分析已有离群点算法的基础上,提出了一种基于数学形态学的离群点检测算法。该算法首次把数学形态学的理论引入到离群点检测中,采用启发式方法自动检测离群点,无论是点状、线状,还是各种复杂的面状(凸面形状、非凸面形状、环面形状等)数据集,算法都能正确和精确地找出离群点,而对于非均匀密度数据集、多密度的数据集,算法也同样地能找出离群点。算法考虑了离群点“局部”的概念。无论与怎样的方式输入感兴趣的数据,对算法确定离群点都没有任何影响。此外,由于使用的是启发式的方法检测,用户只需要输入感兴趣的数据作为输入,而无需输入其它参数即能自动确定出离群点。同时,该算法既适用于栅格系统又适用于矢量系统,且便于进行并行高速处理。
算法循环地用半径由小到大递增变化的圆形结构元对数据库中的各数据点作闭运算,具体地说是半径由0开始,以增幅为1进行变化,这一过程中非邻接点个数以不同速度逐渐减少,当半径为0时所有的数据点都为非邻接点,当半径增大到一定程度时,非邻接点个数为0。随着结构元半径的不断增大,找出非邻接点个数与半径之间存在的关系,最终检测出数据库中存在的离群点。
大量实验和理论分析表明该算法是可行的和有效的,能从数据库中正确并且精确无误地找出离群点。
关键词:数据挖掘,离群点检测,数学形态学,闭运算,非邻接点
ABSTRACT
Data mining is a decision support approach that extracts hidden, unknown, potentially useful knowledge and pattern from huge volume of data. Information is growing at exponential rates and data mining is particularly important in the information age or digital age.
Outlier detection is important areas in data mining. One’s noise is maybe one’s signal. For many KDD (Knowledge Discovery in Databases) applications, it is more interesting to find the exceptional instances or the outliers than to find the common pattern or knowledge. Therefore, outlier itself is perhaps very important. Outlier detection has important applications in the fields of credit-card fraud detection, monitoring criminal actives in E-commerce, network robustness analysis, intrusion detection, and even the analysis of performance statistics of professional athletes. To sum up, outlier detection is a very significant subject in data mining.
In this paper, based on the analysis of existing outlier detection algorithms, a new algorithm of outlier detection that is called ODMM (an Outlier Detection algorit
您可能关注的文档
- 【精品文档】Xx医院“十三五”发展规划--115779532.doc
- 【精品文档】医院工作制度与人员岗位职责大全.doc
- 【精品营销论文】卡尔丹顿男鞋的市场进入营销策略--101974254.doc
- 【精品论文】烟草废水处理及再生回用技术探讨--185505493.doc
- 【精品资料】星级酒店财务管理操作手册范本.doc
- 【纺织工程专业毕业论文】提高双层弹力布入库一等品率的探讨--131888662.doc
- 【经济学论文】中国银行业的风险与出路--172612139.doc
- 【经济类论文】关于我国电信监管政策的分析研究--142573070.doc
- 【经管专业毕业论文】浙江民营企业人力资源管理问题及对策研究--114707621.doc
- 【自动化专业毕业论文】Robocup机器人足球赛3D仿真应用程序设计--190157164.doc
最近下载
- 2025年秋新人教版三年级上册数学全册教学课件.pptx
- 初中道德与法治统编版七年级上册第三单元 珍爱我们的生命第八课 生命可贵认识生命 (1).pptx
- 长期卧床患者的皮肤护理与预防压疮课件.pptx VIP
- iso-10816-3-2009机械振动标准.docx VIP
- 健康管理学知到智慧树期末考试答案题库2025年上海健康医学院.docx VIP
- (2025秋)部编版二年级语文上册 《 去外婆家》精品教案.pdf VIP
- HD 60364-4-41-2017 国外国际规范.pdf VIP
- 从维熙《秋山寻野》.docx VIP
- 初中道德与法治新人教版七年级上册第三单元《珍爱我们的生命》教案(2024秋).doc VIP
- 居住建筑节能设计标准.pdf VIP
文档评论(0)