- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
专业资料,精品文档!
_______________________________________________________________________________
数据挖掘研究的综述
李湘军
中国农业大学信息与电气工程学院 100094
xiang602@163.com
摘要:数据挖掘是一种从大量数据中提取有用信息的技术,是当前计算机科学研究的活跃领
域。本文介绍了数据挖掘的定义,功能以及数据挖掘的过程,然后论述了数据挖掘的常用技
术和工具,最后结合当前新的研究成果分析了数据挖掘领域的发展趋势。
关键词:数据挖掘 知识发现 关联规则
1.引言
随着信息技术的快速发展,人们要面对越来越庞大的数据。加州伯克利分校研究人员研
究表明,全球信息生产量在1999 年到2002 年3 年间以平均每年30%左右的速度递增,2002
年中达到五万亿兆字节,这足以填满50 万座美国国会图书馆[1]。“信息爆炸”时代的到来,
使得要从数量庞大、纷繁复杂的数据中寻找有价值信息的使用者深感头疼。人们的目光转向
了数据挖掘(Data Mining )技术。
一般说来,数据挖掘(DM)是一个利用各种分析方法和分析工具在大规模海量数据中建
立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。例如:超市分
析交易数据,可以安排货架上货物摆布,以提高销售;信用卡公司分析信用卡历史数据,判
断哪些人有风险,哪些没有;广告公司通过分析人们购买模式,估计他们的收入和孩子数目,
作为潜在的市场信息;税务局则可分析不同团体交所得税的记录,发现异常模型和趋势。数
据挖掘还有其他叫法如数据挖掘和知识发现(DMKD)、数据库中知识发现(KDD)、数据融合
(Data Fusion)等等,但在产业界和研究界更加流行数据挖掘和数据库中知识发现的叫法。
数据挖掘涉及多种学科领域,包括数据库、人工智能、数理统计、神经网络、可视化、
并行计算等。在电子数据处理的初期,人们就曾试图通过机器学习等领域的方法来实现自动
决策支持,但收效不大。后来随着神经网络技术的形成和发展,人们的注意力又转向知识工
程。80 年代人们又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成
果应用于处理大型商业数据库。KDD (数据库知识发现),即数据挖掘就于20 世纪80 年代后
期出现了[2]。数据挖掘技术的发展紧随着数据库技术的发展。60 年代,数据库技术还处于
数据收集和静态数据访问阶段,以后逐渐演化到复杂的数据库系统。70 年代以后,又从层
次和网络数据库发展到关系数据库。80 年代中期以来,数据仓库(Ware House)由于其面
向主题、集成性、时变性和非易失性的特点,已成为数据分析和联机分析处理的重要平台[3],
这为数据挖掘的蓬勃发展奠定了基础。
数据挖掘从 1989 年第十一届国际联合人工智能学术会议上正式提出以来,学术界就没
_______________________________________________________________________________中国科技论文在线
有中断过对它的研究。国际KDD 组委会于1995 年把专题讨论会更名为国际会议,深入地探
讨发现方法和系统应用,1997 年第3 届KDD 国际学术大会上还进行了数据挖掘工具的竞赛
评奖活动,2003 年 ACM-SIGKDD 在华盛顿组织了第 9 届知识发现与数据挖掘国际会议
(KDD`03)。数据挖掘在学术界和工业界的影响越来越大,本世纪将会继续成为计算机科学
界的热点。
2.数据挖掘的功能
数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标
是从数据库中发现隐含的、有意义的知识,按其功能可分为以下几类:
1.关联分析
关联分析能寻找到数据库中大量数据的相关联系,常用的两种技术为关联
您可能关注的文档
最近下载
- 必修一 1.1质点与参考系.pptx VIP
- 网络设备配置与管理项目教程(华为eNSP模拟器版)全册电子课件汇总.pptx
- 2024年新人教版7年级上册英语全册课件(新版教材).pptx
- DM.05 ×× U9 ERP项目-项目日报-年月日.docx VIP
- DM.01 ×× U9 ERP项目-项目章程.pptx VIP
- (含六套期末试卷)七年级下册地理精品学案:第2课时复杂的气候.doc VIP
- DM.18 ×× U9 ERP项目-阶段汇报.pptx VIP
- DM.16.01 ××U9 ERP项目培训计划书.docx VIP
- 标准图集-03J601-2 木门窗(部品集成式).pdf VIP
- 2025年江苏省高考化学试卷真题(含答案及解析).pdf
文档评论(0)