第4章:联机分析处理技术.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章:联机分析处理技术

OLAP中的多维分析操作 钻取Drill/Roll up , Drill down 改变维的层次,变换分析的粒度 分向上钻取和向下钻取 向上钻取:在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数 向下钻取:从汇总数据深入到细节数据进行观察或增加新维 OLAP中的多维分析操作 OLAP中的多维分析操作 切片和切块 切片:在给定数据立方体的一个维上进行选择操作,切片的结果是得到一个二维平面数据,如银行分行=“分行1” OLAP中的多维分析操作 切片和切块 切块:在给定数据立方体的两个或多个维上进行选择操作,切块的结果是得到一个子立方体,如(银行分行=“分行1”OR “分行2”)AND (时间=“2007年”OR “2008年”) AND(银行支行=支行1”OR “支行2” ) OLAP中的多维分析操作 旋转 变换维的方向,即在表格中重新安排维的放置,如行列互换 OLAP中的多维分析操作 旋转 变换维的方向,即在表格中重新安排维的放置,如行列互换 OLAP中的多维分析操作 概化(generalize) 通过用高层抽象(如time维的year)值替换低层抽象(如time维的day)值,概念分层可以用于概化数据; 特化(specialize) 通过用低层抽象(如time维的day)值替换高层抽象(如time维的year)值,概念分层可以用于特化数据; OLAP的基本数据模型 OLAP系统一般以数据仓库作为基础,从数据仓库中抽取详细数据的一个子集,经过必要的聚集存储到OLAP存储器中供前端分析工具读取 为了保证信息处理所需的数据以合适的粒度、合理的抽象程度和标准化程度存储,按照其数据存储格式可以分为关系OLAP(ROLAP)、多维OLAP(MOLAP)和混合OLAP(HOLAP) OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 以关系型的结果进行多维数据的表示与存储 数据的预处理程度不高,灵活性高 一般采用星状模式或雪花模式来表达多维数据视图 OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 星状模式 一个事实表:包含大批数据并且不含冗余的中心表 一组小的维表,每维一个 OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 星状模式 OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 雪花模式 是星状模式的变种 某些维是规范化的,把数据进一步分解到附加表中 OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 雪花模式 OLAP的基本数据模型 关系联机分析处理 ROLAP的数据模型 雪花模式与星状模式的区别 雪花状的维表可能是规范化形式,以便减少冗余,易于维护,节省存储空间 由于执行查询需要更多的连接操作,雪花状结构可能降低浏览的性能 OLAP的基本数据模型 多维联机分析处理 MOLAP利用一种专有的多维数据库来存储OLAP分析所需要的数据 数据采用n维数组的多维方式存储,形成“立方体”结构 MOLAP存储模式将数据与计算结果都存储在立方体结构中,即将多维数据集区的聚合、维度、汇总数据以及其源数据的副本等信息均以多维结构存储在分析服务器上。 MOLAP的数据模型 MOLAP是表现为“超立方”结构,采用类似于多维数组的结构。 例如,二维MDDB(数组,即矩阵)的数据组织见下表 北京 上海 广州 衣服 600 700 500 鞋 800 900 700 帽子 100 200 80 * OLAP的基本数据模型 多维联机分析处理 MOLAP的优缺点 迅速响应决策分析人员的分析请求(预处理程度高) 用户很难对维数进行动态变化,如增加一维 对数据变化的适应能力较差-需重构多维数据库 处理大量细节数据的能力差 OLAP的基本数据模型 MOLAP和ROLAP的比较 ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。 MOLAP在数据存储速度上性能好,响应速度快。 * 数据存取速度 ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。 MOLAP通常采用多平面叠加成立体的方式存放数据。 MOLAP受操作系统平台中文件大小的限制,当数据量超过操作系统最大文件长度时,需要进行数据分割。 多维数据库的数据量级难以达到TB 级(只能10~20G) * 数据存储的容量 MOLAP增加新的维度,则多维数据库通常需要重新建立。 ROLAP对于维表的变更有很好的适应性。 * 维度变化的适应性 当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。 在ROLAP中灵活性较好,对于数据变化的适应性高。 * 数据变化的适应性 * MOLAP VS ROLAP

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档