- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14卷第1期 模式识别与人工智能 V01.14No.1
2001年3月 PRAI March2001
数据挖掘综述
钟 晓
(浙江大学计算机系人工智能研究所智能软件实验室杭州 310027)
马少平 张钹
(清华大学计算机科学技术系北京100084)
(清华大学智能技术与系统国家重点实验室北京100084)
俞瑞钊
(浙江大学计算机系人工智能研究所智能软件实验室杭州 310027)
摘要数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域.本文结合具体实
例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述.
关键词数据挖掘,关联规则,分类,聚类
中图法分类号TPl8,TP392
1 引 言 潜在、有效并能被人理解的模式的高级处理过程.
在较浅的层次上,它利用现有数据库管理系统
的查询、检索及报表功能,与多维分析、统计分析方
人们在日常生活中经常会遇到这样的情况:超
法相结合,进行联机分析处理(O乙心),从而得出可
市的经营者希望将经常被同时购买的商品放在一
供决策参考的统计分析数据.在深层次上,则从数据
起,以增加销售额;保险公司想知道购买保险的客户
一般具有哪些特征;医学研究人员希望从已有的成
于数据挖掘,它们都是从数据库中抽取有用信息的
千上万份病历中找出患某种疾病的病人的共同特
方法,就决策支持的需要而言两者是相辅相成的.
征,从而为治愈这种疾病提供一些帮助等等.对于这
些问题,现有信息管理系统中的数据分析工具无法
简化和支持联机分析,而数据挖掘的目的是便这一
给出解决办法.因为无论统计、查询或报表,其处理
过程尽可能自动化.
方式都是对指定数据进行简单的数字处理,而不能
数据挖掘基于的数据库类型主要有:关系型数
对这些数据所包含的内在信息进行提取.而随着数
据库、面向对象数据库、事务数据库、演绎数据库、时
据量的激增,人们越来越希望系统能够提供更高层
态数据库、多媒体数据库、主动数据库、空间数据库、
次的数据分析功能,从而更好地支持决策或科研工
作.
及新兴的数据仓库(Data
正是为了满足这种要求,数据挖掘技术应运而
得的知识包括关联规则、特征规则、区分规则、分类
生.
规则、总结规则、偏差规则、聚类规则、模式分析及趋
势分析等.
2什么是数据挖掘
原创力文档


文档评论(0)