网站大量收购独家精品文档,联系QQ:2885784924

第二十讲数据仓库、联机分析处理和数据挖掘.pptVIP

第二十讲数据仓库、联机分析处理和数据挖掘.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二十讲 数据仓库、联机分析处理和数据挖掘 本 讲 主 要 目 标 学完本讲后,你应该能够了解: 数据仓库的定义; 数据仓库的特点是:面向主题的、集成的、非易失的和随时间变化的; OLAP的特点和基本操作:上钻(drill up)、下钻(drill down) 、切片(slice) 、切块(dice)和旋转(Pivot,rotate) OLAP的三种实现方式:ROLAP,MOLAP,HOLAP 数据挖掘的定义及与传统知识处理技术的不同 一.数据仓库的定义和特点 二.数据仓库的体系结构 三.OLAP概述 四.OLAP的基本操作 五.OLAP的实现方法 六. 数据挖掘概述 数据仓库的 定义和特点 数据仓库的定义和特点 世界公认的数据仓库概念创始人W.H.Inmon在《数据仓库》(Building the Data Warehouse)一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、非易失的(稳定性)、随时间变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。 数据仓库的定义和特点 数据仓库的特点 数据仓库的定义和特点 面向主题的 数据仓库的定义和特点 集成的 数据仓库的定义和特点 集成的 数据仓库的定义和特点 非易失的 数据仓库的定义和特点 非易失的 数据仓库的定义和特点 随时间变化的 数据仓库的定义和特点 随时间变化的 数据仓库的 体系结构 数据仓库的体系结构 数据仓库的数据结构 数据仓库的体系结构 数据仓库的体系结构 OLAP概述 OLAP 概 述 什么是OLAP? OLAP是针对特定问题的联机数据访问和分析。 通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察 OLAP 概 述 维(Dimension) 维是人们观察数据的特定角度。 例如,企业常常关心产品销售随着时间推移而产生的变化的情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。 企业也常常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。 OLAP 概 述 维的层次 人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这个描述方面为维的层次。 一个维往往具有多个层次,例如: 描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次; 同样,城市、地区、国家就构成了一个地理维的多个层次。 OLAP 概 述 维成员 维的一个取值就称为该维的一个维成员。 如果一个维是多层次的,那么该维的维成员就是不同维层次的取值的组合。 例如,考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到时间维的一个维成员,即“某年某月某日”。 OLAP概述 OLTP与OLAP的差异 OLAP的 基本操作 OLAP的基本操作 钻取:在一个维内部沿着层次从上到下或从下到上的方向考察数据 上钻(Drill up) 下钻(Drill down) 切片/切块(Slice and dice) 固定某些维成员,对其它维进行考察 旋转(Pivot,rotate) 按不同顺序组织各个维,对结果进行考察 OLAP的基本操作 一个OLAP操作实例: OLAP的基本操作 钻取(Dill up/Drill down): OLAP的基本操作 切片 OLAP的基本操作 旋转 按不同顺序组织各个维,对结果进行考察 OLAP的 实现方法 OLAP的实现方法 OLAP服务器的实现方法 关系OLAP (ROLAP) 多维OLAP (MOLAP) 混合OLAP (HOLAP) OLAP的实现方法 OLAP服务器的特征 查询性能 空间占用 分析查询能力 OLAP的实现方法 ROLAP服务器的原理 OLAP的实现方法 MOLAP服务器的原理 OLAP的实现方法 HOLAP服务器的原理 数据挖掘概述 数据挖掘概述 为什么需要数据挖掘? 数据挖掘概述 数据挖掘的定义 就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,识别出有效的、新颖的、潜在有用的,以及最终可理解的模式(或知识)的非平凡过程。 需要指出的是,这里所说的知识,不是放之四海而皆准的真理,而是相对的。 数据挖掘概述 数据挖掘是多学科的交叉 数据挖掘概述 数据挖掘与数据仓库的关系 数据挖掘是数据仓库发展的必然结果 数据仓库为数据挖掘提供应用基础 Questions? 本 讲 主 要 目 标 学完本讲后,你应该能够了解: 数据仓库的定义; 数据仓库的特点

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档