数据仓库数据挖掘技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘技术 第一章 数据仓库与数据挖掘概述 第一章 数据仓库与数据挖掘概述 1.1数据仓库引论 1.1.1为什么要建立数据仓库? 数据仓库的作用 数据仓库的优点 第一章 数据仓库与数据挖掘概述 1.1.2什么是数据仓库? 数据仓库的概念 定义1:数据仓库是面向主题的,集成的,随时间变化的,历史的,稳定的,支持决策制定过程的数据集合。 定义2:数据仓库是作为DSS基础的分析型DB,用来存放大容积只读数据,为制定决策提供所需的信息。 定义3:数据仓库是与操作系统相分离的,基于标准企业模型集成的带有时间属性的。 第一章 数据仓库与数据挖掘概述 定义4:数据仓库是一种来源于各种渠道的单一的,完整的,稳定的数据存储。 定义5:数据仓库是大量有关公司数据的数据存储。 定义6:数据仓库是提供公司数据以及组织数据的访问功能,其中的数据是一致的,并且可以按每种可能的商业度量方式分解和组合;数据仓库也是一套查询,分析和呈现信息的工具;数据仓库是我们发布所用数据的场所。 定义7:数据仓库是一种为信息分析提供良好基础并支持管理决策活动的分析环境,是面向主题的,集成的,稳定的,不可更新的,随时间变化的,分层次的多维的集成数据集合。 第一章 数据仓库与数据挖掘概述 与数据仓库相关的几个概念 操作数据 来自组织的进入数据仓库的操作型数据 原子数据 由单独数据项组成的数据仓库最底层的数据 汇总数据 提前计算出来并存储在数据仓库数据库中为日后需要时调用的数据 特定查询响应 反映用户查询要求结果的数据 第一章 数据仓库与数据挖掘概述 与数据仓库相关的几个概念 元数据 描述数据仓库与数据库内容的数据 数据库 一组内部相关联的数据集合 数据库管理系统 用来管理和存储数据库的一组软件 数据库系统 由硬件,软件,数据库和管理人员组成的复杂系统 数据集市 小型化,针对特定目标且建设成本很低的一种数据仓库 第一章 数据仓库与数据挖掘概述 1.1.3数据仓库的特点 主题与面向主题 数据仓库数据的集成性 数据仓库数据的不可更新性 数据仓库数据的时态性 第一章 数据仓库与数据挖掘概述 1.1.4 数据进入数据仓库的基本过程与建立数据仓库的步骤 数据进入数据仓库的基本过程 建立数据仓库的步骤 第一章 数据仓库与数据挖掘概述 1.1.5 分析数据仓库的内容 用户引导分析-联机分析(on-line analytical processing , OLAP) 自动分析----数据挖掘(data mining, DM) 第一章 数据仓库与数据挖掘概述 1.2 数据挖掘导论 1.2.1 为什么要进行数据挖掘 数据挖掘的作用 数据挖掘的背景 数据挖掘对企业的影响 第一章 数据仓库与数据挖掘概述 1.2.2 什么是数据挖掘 1.数据挖掘的概念 定义8:从数据库的大量数据中揭示出隐含的,先前未知的,潜在有用的信息的非平凡过程。 定义9:数据库中知识的发现。 定义10:发现数据中隐藏的模式和关系的过程。 定义11:从大量数据中提取或挖掘知识。 定义12:数据挖掘是知识发现过程中特定关键的一步。 定义13:在一些事实或观察数据的集合中寻找模式的决策支持的过程。 第一章 数据仓库与数据挖掘概述 2 数据挖掘的分类 第一章 数据仓库与数据挖掘概述 3 与数据挖掘相关的几个概念 直接数据挖掘 间接数据挖掘 描述式数据挖掘 预测式数据挖掘 数据库查询工具和数据挖掘工具之间的差异 信息 知识 数据,信息与知识的转化关系 第一章 数据仓库与数据挖掘概述 1.2.3 数据挖掘的特点 处理数据规模庞大 用户没有精确的查询要求,因此依靠数据挖掘技术来寻找其可能感兴趣的东西 数据挖掘对数据迅速变化做出快速响应 数据挖掘既要发现潜在规则,管理和维护规则,随新数据不断增加,规则需要随新数据更新 数据挖掘中规则的发现基于统计规律,发现的规则不必适合于所有数据,而且达到某一阈值时,便认为有此规则 第一章 数据仓库与数据挖掘概述 1.2.4 数据挖掘的基本过程 1 数据挖掘基本过程 数据准备 挖掘 表述 评价 第一章 数据仓库与数据挖掘概述 2 进行数据挖掘的步骤 问题定义 发现信息 制定计划 采取行动 检测效果 第一章 数据仓库与数据挖掘概述 1.2.5分析数据挖掘的内容 直销 争取客户 保留客户 交叉销售 趋势分析 欺诈检测 第一章 数据仓库与数据挖掘概述 1.3 数据挖掘与数据仓库的关系 数据仓库和数据挖掘都可以认为是独立的体系。之所以放在一起是因为基于数据仓库的挖掘才更加能够保障数据挖掘的效果。数据仓库是面向稳定、非易变、主题的数据组织方式,其索引机制和设计模式就决定了比较适合进行数据挖掘和知识发现。 第一章 数据仓库与数据挖掘概述 1.4数据挖掘与数据仓库的应用 零

文档评论(0)

chqs52 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档