- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术及用
摘要
在很多领域,数据挖掘(Data
Mining)都是一个很时髦的词,尤其是在如银行、
电信、保险、交通、零售(如超级市场)等商业领域。它是--17涉及面很广的交
叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模
糊数学等相关技术。统计学与数据挖掘有着密切的联系。数据挖掘结合了统计学
的方法,同时又超越传统意义上的统计分析。
数据挖掘是从数据中发现知识和寻找规律,并用它们指导生产或管理,提高
效益。它从开始就是面向应用的,不仅仅是面向特定数据库的简单检索查询调
用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理,以
指导实际问题的求解,企图发现事件问的相互关联,甚至利用已有的数据对未来
的活动进行预测。
因此,笔者把文章的核心放到了数据挖掘的技术及其应用上。笔者认为如果
能把海鬓数据库运用各种数据库压缩方法成功的进行压缩,那么对于压缩后的数
据库,运用数据挖掘技术和统计方法就能够挖掘出有价值的信息,所以笔者在文
章中用了很大的篇幅来讲述数据挖掘过程中对数据库的压缩。本文主要由以下四
个部分组成:
第一章,数据挖掘简介。从数据挖掘的概念、功能、目的、主要方法以及数
据挖掘步骤,发现统计学与数据挖掘有着密切的关系:统计学和数据挖掘有着共
同的目标即发现数据中的结构,但数据挖掘并不是统计学的分支,因为数据挖掘
还应用了其它领域的思想、工具和方法,尤其是计算机学科。数据挖掘的出现为
统计学提供了‘个崭新的应用领域,虽然统计学不可能给出数据挖掘所有问题的
答案,但它可以为数据挖掘提供非常有参考价值的框架,能够极大地丰富数据挖
掘的力法。
第二章,数据预处理及数据库的压缩。数据的清理有三种方法:空缺值的填
充、异常点分析以及不一致数据的处理。数据库的压缩方法有很多,在介绍了主
成份分析、信息增益分析技术和属性相关分析等进行维归约之后,引入了半且糙集
理论。粗糙集理论既可以用于压缩数掘库,又可以对属性的重要性程度进行测量
及排序。
摘要
第三章,数据挖掘的常用技术。数据挖掘技术可分为描述型数据挖掘和预测
型数据挖掘两种,描述型数据挖掘包括数据总结、聚类及关联分析等。预测型数
据挖掘包括分类、回归及时间序列分析等。这罩主要介绍了常用的技术:决策树
和决策规则、关联规则和聚类分析。
第四章,数据挖掘技术的应用。本文的应用案例有两个,数据挖掘在移动通
信中的应用以及对一份调查问卷的分析。针对移动通信客户众多,信息量大的特
点,需要刺‘手机用户消费水平的数据库进行压缩,对压缩后的新数据库可以运用
决策树进行分类和关联规则以期找出几项费用与缴费总额之间的联系。而在“大
学生素质培养的调查问卷”案例中,首先将24个影响一个人成长和发展的因素
运用聚类分析进行了分类,然后运用以秩效应为标准进行属性项的排序的方法,
刈24个影响因素的重要性程度进行排序。
最后对论文进行了总结,同时提出了未来在数据库的建立、数据的收集处理
及预测等需要继续研究的几个问题。
关键词:数据挖掘 粗糙集 决策树和决策规则 关联规则
II
Abstract
i na10t
of isa
fields,Data fashionahle
Miningvery
1n commercial
the f{eldssuchasbank,telecommunication,jnsurance.
traffi asthe is across i
c,ret.ailing(suchsupermarkets).ItdisciDlne
j relevant asmachiBe
ncluding technology,such
i
stati
sIcs,neural
network,database,patternset,
文档评论(0)