数据挖掘综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14卷第1期 模式识别与人工智能 V01.14No.1 2001年3月 PRAI March2001 数据挖掘综述 钟 晓 (浙江大学计算机系人工智能研究所智能软件实验室杭州 310027) 马少平 张钹 (清华大学计算机科学技术系北京100084) (清华大学智能技术与系统国家重点实验室北京100084) 俞瑞钊 (浙江大学计算机系人工智能研究所智能软件实验室杭州 310027) 摘要数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域.本文结合具体实 例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述. 关键词数据挖掘,关联规则,分类,聚类 中图法分类号TPl8,TP392 1 引 言 潜在、有效并能被人理解的模式的高级处理过程. 在较浅的层次上,它利用现有数据库管理系统 的查询、检索及报表功能,与多维分析、统计分析方 人们在日常生活中经常会遇到这样的情况:超 法相结合,进行联机分析处理(O乙心),从而得出可 市的经营者希望将经常被同时购买的商品放在一 供决策参考的统计分析数据.在深层次上,则从数据 起,以增加销售额;保险公司想知道购买保险的客户 一般具有哪些特征;医学研究人员希望从已有的成 于数据挖掘,它们都是从数据库中抽取有用信息的 千上万份病历中找出患某种疾病的病人的共同特 方法,就决策支持的需要而言两者是相辅相成的. 征,从而为治愈这种疾病提供一些帮助等等.对于这 些问题,现有信息管理系统中的数据分析工具无法 简化和支持联机分析,而数据挖掘的目的是便这一 给出解决办法.因为无论统计、查询或报表,其处理 过程尽可能自动化. 方式都是对指定数据进行简单的数字处理,而不能 数据挖掘基于的数据库类型主要有:关系型数 对这些数据所包含的内在信息进行提取.而随着数 据库、面向对象数据库、事务数据库、演绎数据库、时 据量的激增,人们越来越希望系统能够提供更高层 态数据库、多媒体数据库、主动数据库、空间数据库、 次的数据分析功能,从而更好地支持决策或科研工 作. 及新兴的数据仓库(Data 正是为了满足这种要求,数据挖掘技术应运而 得的知识包括关联规则、特征规则、区分规则、分类 生. 规则、总结规则、偏差规则、聚类规则、模式分析及趋 势分析等. 2什么是数据挖掘

文档评论(0)

wx171113 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档