数据挖掘概念和技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘概念与技术 英文原书名: Data Mining:Concepts and Techniques 作者: (加)Jiawei Han Micheline Kamber 译者: 范明 孟小峰 等译 书号: 7-111-09048-9 出版社: 机械工业出版社 出版日期: 2001-8-1 页码: 374 定价: ¥39.00 数据挖掘(Data Mining)是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是由于企业数据库的广泛使用,存在大量的数据,并且迫切需要从这些数据中获取有用的信息的知识。获取的信息和知识有广泛的应用,例如:商务管理、生产管理、市场控制、市场分析、工程设计和科学探索等。越来越多的IT企业看到了这一诱人的市场,纷纷加入到数据挖掘工具的开发中来,并获得丰厚的回报。例如微软公司在它的最新的关系数据库系统SQL Server 2000加入了先进的数据挖掘功能,在基于NT的数据库软件市场中打败了Oracle公司,成为销售额最大的产品。又如IBM公司发布了一项新型的基于标准的数据挖掘技术--IBMDB2智能挖掘器积分服务(IBM DB2 Intelligent Miner Scoring Service),它可以帮助企业轻松地为自己的客户和供应商开发出个性化的解决方案。从种种迹象表明,数据挖掘这一研究领域的发展充满了机遇和挑战。   《数据挖掘:概念与技术》一书从数据库专业人员的角度,全面深入地介绍了数据挖掘原理和在大型企业数据库中知识发现的方法。该书首先用浅显的语言介绍了数据挖掘的概念、数据挖掘系统的基本结构、数据挖掘系统的分类等,逐渐地把读者领入该领域,这一点做得非常好。作者接着便全面而详细的介绍了数据挖掘技术,其中还包括了当前的最新进展。书中的每一章之间都是相对独立的,分别对不同的关键主题进行了详细的描述。每一章所介绍的方法和实现都是可靠的并经过验证的,能够直接应用或根据实际需要在策略上稍加修改即可使用。此外,作者在每个可能的地方都会提出一些关于实用性、可行性、最优化以及可伸缩性等方面的问题,并给出他自己的回答。通过这样一些问题,能够把读者引向许多对方案的效果甚至最终成功与否产生影响的关键问题,而不是仅仅停留在技术的表面。如果没有很深的技术功底和丰富的实践经验是很难做到这一点的,但作者做到了,而且做的非常好。   另外值得一提的是,该书的译者都是本领域的专家。从翻译的角度来看,译者对一些关键词语的掌握比较准确,而且语言流畅,读起来没有艰涩的感觉。不过,该书本身牵涉到一些比较深的理论问题,所以不可能非常通俗易懂。但这并不是翻译的问题。   综上所述该书有如下的几大特点:  1、从实用的角度全面地描述了必要的数据挖掘概念和技术。  2、把各章组织为独立的部分,使读者能够聚焦于自己感兴趣的课题,并立即应用所学到的方法。  3、提供了大量的算法和实际的应用例子,并且用易懂的伪代码来进行描述。所有这些算法和例子能够适用于实际的大规模数据挖掘项目。  4、包含了各种在实践中必要的数据挖掘技术,包括:OLAP和数据仓库、数据预处理、概念描述、关联规则、分类和预测、聚类分析等。  5、包含了基于先进数据库的数据挖掘方法,如对象-关系数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库和万维网中的数据挖掘。   当然该书也有一些缺点,如存在少量的文字错误、有些地方描述前后不一致以及某些语言比较难懂等。但瑕不掩瑜,该书是从事数据挖掘的专业人士和研究者期待已久的一本非常优秀的必备参考书,同样也是一本很好的专业教科书。 书的目录                 ??? ? ? ? 译者序 序 前言 第1章 引言 1 1.1 什么激发了数据挖掘,为什么它是重要的 1 1.2 什么是数据挖掘 3 1.3 在何种数据上进行数据挖掘 6 1.3.1 关系数据库 7 1.3.2 数据仓库 8 1.3.3 事务数据库 10 1.3.4 高级数据库系统和高级数据库应用 11 1.4 数据挖掘功能—可以挖掘什么类型的模式 14 1.4.1 概念/类描述:特征化和区分 14 1.4.2 关联分析 15 1.4.3 分类和预测 16 1.4.4 聚类分析 16 1.4.5 孤立点分析 17 1.4.6 演变分析 17 1.5 所有模式都是有趣的吗 18 1.6 数据挖掘系统的分类 19 1.7 数据挖掘的主要问题 20 1.8 小结 22 习题 22 文献注释 23 第2章 数据仓库和数据挖掘的OLAP技术 26 2.1 什么是数据仓库 26 2.1.1 操作数据库系统与数据仓库的 区别 27

文档评论(0)

mtyi297 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档