- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种离群数据集延伸知识发现框架
华 南 理 工 大学 学 报 (自然科 学版 )
JournalofSouthChinaUniversityofTechnology Vo1.36 NO.9
第 36卷 第9期 .
2008年9月 (NaturalScienceEdition) September 2008
文章编号:1000-565X(2008)09—0031—06
一 种离群数据集延伸知识发现框架木
金义富 朱庆生
(重庆大学 计算机学院,重庆400044)
摘 要:现有离群数据研究主要集中于离群检测.为了对离群数据的来源、分类、含义、行
为特征以及离群趋势等进行全面分析,以现有离群挖掘技术为基础,结合 已提出的离群约
简与关键域子空间等一系列概念及其搜索算法,定义了离群最近邻、原子离群类及离群变
异类等概念,提 出了离群簇分析及离群趋势分析方法,建立了一种完整的离群数据集特征
描述及延伸知识发现的整体框架.通过对移动通信业务数据的离群分析进行具体讨论,表
明了这种离群延伸知识发现框架在实际应用中的有效性.
关键词:数据挖掘;离群分析;关键域子空间;知识发现框架
中图分类号:TP311 文献标识码:A
离群数据检测是数据挖掘的重要组成部分.在 对每一种离群数据进行聚类分析,以及对时序数据
数据空间中,离群点是那些远离常规对象 的数 的离群趋势进行分析等.
据 ‘,表现为与多数常规对象有 明显差异,以至于 现有离群数据研究主要集 中于离群数据挖
被怀疑可能是 由另外一种完全不同的机制产生.离 掘 ,且其挖掘的 目的仅仅是为了去除被发现的
群点对常规数据挖掘算法会产生严重的影响 .离 离群对象以获得更好的数据质量,为常规数据挖掘
群点可能是在数据形成过程 中出现的错误所导致 , 与分析提供更稳定、更可靠的结果,较少对挖掘出的
这类数据一般可以剔除或以某种方法进行替换 ;但 离群数据作进一步的研究.虽然对离群数据集进行
离群点也可能表明的是一些并非错误的特殊情况, 准确完整的分析不可避免地要具备足够的问题领域
其中可能蕴含着极其重要的信息,如在信用卡欺诈 知识,但从数据集及离群点在属性域子空间中的分
检测、通信盗用及网络入侵检测等领域中,离群点是 布特性等方面进行研究,可 以获得相当丰富的关于
数据分析的主要对象 ;在疾病诊断、天文观察乃 离群点的扩展知识.
至所有科学研究领域,离群数据对象可能预示着一 文中以现有离群挖掘算法为基础 ,结合 已提出
种新的视角 ,从而导致新理论或新应用 的出现.显 的离群约简及关键域子空间等一系列概念 ,以及相
然,应该对这类离群点作进一步的分析,以获取从常 应的离群约简及关键域子空间搜索算法 、离群数据
规模式不能得到的新知识.因此,对离群数据集的研 聚类算法 j,对关键域子空间进行分类讨论,定义
究包含如下两个方面: 了离群最近邻、原子离群类及离群变异类等概念,提
(1)离群数据挖掘.从数据集 中挖掘 出离群对 出离群簇分析及离群趋势分析方法,建立一种完整
象形成离群数据集是研究的前提. 的离群数据集特征描述及延伸知识发现的框架
(2)离群数据分析.对挖掘出的离群数据进行 (CEKDO),以期对离群数据 的分类 、来源 、含义 、行
您可能关注的文档
- -北京大学网络与信息系统研究所.doc
- -南方医科大学综合信息门户.doc
- -广州从化区住房和建设局.doc
- 2005年公路工程质量统计分析报告-湖州交通质监站湖州交通工程.doc
- 2006财政年要点.pdf
- 2009年重庆建筑业生产情况分析.pdf
- 2010年质量检查用表.doc
- 2011年主考学校自办助学专业一览表-江苏教育考试院.doc
- 2011高考物理最近6年真题解析10.doc
- 2010年无锡医院管理中心直属医疗机构骨科医用耗材网上集中采购.pdf
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
文档评论(0)