数据挖掘CHAPTER1引言.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个人收集整理 仅供参考学习 第一章 引言 本书是一个导论,介绍什么是数据挖掘,什么是数据库中知识发现。书中的材料从数据库 角度提供,特别强调发现隐藏在大型数据集中有趣数据模式的数据挖掘基本概念和技术。所讨论 的实现方法主要面向可规模化的、有效的数据挖掘工具开发。本章,你将学习数据挖掘如何成为 数据库技术自然进化的一部分,为什么数据挖掘是重要的,以及如何定义数据挖掘。你将学习数 据挖掘系统的一般结构,并考察挖掘的数据种类,可以发现的数据类型,以及什么样的模式提供 有用的知识。除学习数据挖掘系统的分类之外,你将看到建立未来的数据挖掘工具所面临的挑战 性问题。 1.1 什么激发数据挖掘?为什么它是重要的? 需要是发明之母。 近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使 用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应 用,包括商务管理、生产控制、市场分析、工程设计和科学探索等。 文档来自于网络搜索 数据挖掘是信息技术自然进化的结果。进化过程的见证是数据库工业界开发以下功能(图 1.1):数据收集和数据库创建,数据管理(包括数据存储和提取,数据库事务处理),以及数 据分析与理解(涉及数据仓库和数据挖掘)。例如,数据收集和数据库创建机制的早期开发已成 为稍后数据存储和提取、查询和事务处理有效机制开发的必备基础。随着提供查询和事务处理的 大量数据库系统广泛付诸实践,数据分析和理解自然成为下一个目标。 文档来自于网络搜索 自 60 年代以来,数据库和信息技术已经系统地从原始的文件处理进化到复杂的、功能强大 的数据库系统。自 70 年代以来,数据库系统的研究和开发已经从层次和网状数据库发展到开发 关系数据库系统(数据存放在关系表结构中;见 1.3.1 小节)、数据建模工具、索引和数据组织 技术。此外,用户通过查询语言、用户界面、优化的查询处理和事务管理,可以方便、灵活地访 问数据。 联机事务处理 (OLTP )将查询看作只读事务,对于关系技术的发展和广泛地将关系技术 作为大量数据的有效存储、提取和管理的主要工具作出了重要贡献。 文档来自于网络搜索 自 80 年代中期以来,数据库技术的特点是广泛接受关系技术,研究和开发新的、功能强大 的数据库系统。这些使用了先进的数据模型,如扩充关系、面向对象、对象 -关系和演绎模型。 包括空间的、时间的、多媒体的、主动的和科学的数据库、知识库、办公信息库在内的面向应用 的数据库系统百花齐放。涉及分布性、多样性和数据共享问题被广泛研究。异种数据库和基于 Internet 的全球信息系统,如 WWW 也已出现,并成为信息工业的生力军。 文档来自于网络搜索 在过去的三十年中,计算机硬件稳定的、令人吃惊的进步导致了功能强大的计算机、数据收 集设备和存储介质的大量供应。这些技术大大推动了数据库和信息产业的发展,使得大量数据库 和信息存储用于事务管理、信息提取和数据分析。 文档来自于网络搜索 现在,数据可以存放在不同类型的数据库中。最近出现的一种数据库结构是 数据仓库 (1.3.2 小节)。这是一种多个异种数据源在单个站点以统一的模式组织的存储,以支持管理决策。数据 仓库技术包括数据清理、数据集成和 联机分析处理 (OLAP )。 OLAP 是一种分析技术,具有汇 总、合并和聚集功能,以及从不同的角度观察信息的能力。尽管 OLAP 工具支持多维分析和决 策,对于深层次的分析,如数据分类、聚类和数据随时间变化的特征,仍然需要其它分析工具。 文档来自于网络搜索 1 / 23 个人收集整理 仅供参考学习

文档评论(0)

wei173 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档