数据仓库与数据挖掘基础第2章OLAP赵志升2015修改.pptVIP

数据仓库与数据挖掘基础第2章OLAP赵志升2015修改.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节 基于数据仓库的数据挖掘 1 、 数据仓库的使用 数据仓库的三种应用: ? 信息处理 ? 分析处理 ? 数据挖掘 第四节 基于数据仓库的数据挖掘 1 、 数据仓库的使用 信息处理 :支持查询和基本的统计分析,并 使用交叉表、表、图表或图进行报告。数据仓库 信息处理的当前趋势是构造低成本的基于 Web 的 存取工具,然后与 Web 浏览器集成在一起。 第四节 基于数据仓库的数据挖掘 1 、 数据仓库的使用 分析处理 :支持基本的 OLAP 操作,包括切 片与切块、下钻、上卷和转轴。一般在汇总的和 细节的历史数据上操作,它支持数据仓库的多维 数据分析。 第四节 基于数据仓库的数据挖掘 1 、 数据仓库的使用 数据挖掘 :支持知识发现,包括找出隐藏的 模式和关联,构造分析模型,进行分类和预测, 并用可视化工具提供挖掘结果。 数据挖掘不限于分析数据仓库中的数据,比 OLAP 更自动化,更深入,应用更广。 第四节 基于数据仓库的数据挖掘 2 、 从 OLAP 到 OLAM OLAM 联机分析挖掘将联机分析处理与数据 挖掘以及多维数据库中的发现知识集成在一起。 ? 数据仓库中的数据高质量 ? 环绕数据仓库的有价值的信息处理基础设施 ? 基于 OLAP 的探测式数据分析 ? 数据挖掘功能的联机选择 4.2 多维数据模型上的 OLAP 操作: 4 、 多维数据模型上的 OLAP 操作: 有钻取( Drill-up 和 Drill-down )、切片( Slice )和切块( Dice )、以及旋转( Pivot )等。 钻取: 是改变维的层次,变换分析的粒度。它包括向下钻取( Drill- down )和向上钻取( Drill-up ) / 上卷 (Roll-up) 。 Drill-up 是在某一维上 将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而 Drill- down 则相反,它从汇总数据深入到细节数据进行观察或增加新维。 切片和切块 : 是在一部分维上选定值后,关心度量数据在剩余维上的分 布。如果剩余的维只有两个,则是切片;如果有三个或以上,则是切块。 旋转: 是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。 OLAM 产生的原因 ? 另一方面,数据挖掘虽然可以使用复杂算法来分析数据和创建模型表 示有关数据的信息,用户也不必提出确切的要求,系统就能够根据数 据本身的规律性,自动地挖掘数据潜在的模式,或通过联想,建立新 的业务模型以辅助决策。但它也存在一些缺点 : ? 1) DM 是挖掘型分析工具,是由数据驱动的。用户需要事先提出挖 掘任务。但对于用户来讲,很多时候预先是不知道想挖掘什么样的知 识的。 2) 由于数据库或数据仓库中存有大量数据和信息,用户仅仅指出挖 掘任务,而不提供其他搜索线索,这样 DM 工具就会遍历整个数据库, 导致搜索空间太大。计算机将处于长时间的工作,而且结果中可能会 生成很多无用信息。 3) 即使挖掘出了潜在有价值的信息,但它究竟用来做什么分析用, 用户也可能不清楚。 ? ? OLAM 产生 ? 两种技术各存在不足,但同时也可以相辅相成。如果将 OLAP 同 DM 配合集成, 一方面 OLAP 的分析结果给 DM 提供挖掘的依据,引导 DM 的进行 ; 另一方面,在数据挖掘的结果中进行 OLAP 分析,则 OLAP 分析的深度就可拓展。这样用户就可以灵活选择 所需的数据挖掘功能,并动态交换挖掘任务,在数据仓 库的基础上提供更有效的决策支持。 鉴于 OLAP 与 DM 技术在决策分析中的这种互补性, 促成了 OLAM 技术的形成。 ? ? ? 发展 olam 的原始驱动力有以下几点: ( 1 ) data mining 工具需要的数据是一些经过净化、集成处理的数 据,通常这种处理过程也是昂贵的;而 dw ( data warehouse ,数据仓 库)作为 olap 的数据源,存储的就是这样的数据。它能为 olap 提供数据, 当然也可以为 dm 提供数据。 ( 2 ) dm 是一项崭新的技术,很多人在研究它。围绕着它有许多工具 或是体系结构。而 dm 作为数据分析工具的一种,不是孤立的,必然要与 其他的工具发生联系。因此,考虑到如何最大限度地利用这些现成的工 具,也是 olam 发展之初所关心的问题。 ( 3 )成功的数据挖掘需要对数据进行钻探性( exporatory )分析。 例如,挖掘所需的数据可能只是一部分、一定范围的数据。因此,对多 维数据模型的切片、切块、下钻等操作,同样可以应用于 dm 的过程中。 也就是说,可以将 dm 建立在多维模型(或说超级立方体)的基础之上。 ( 4 )用户的参与对 dm 非常重要,它动态地提出挖掘要求,选择挖掘 算法。故可以将 olap 的

文档评论(0)

wq1987 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档