- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第4章
在线教务辅导网:;第四章 联机分析处理(OLAP);第四章 目录;数据仓库是管理决策分析的基础,要有效地利用数据仓库的信息资源,必须要有强大的工具对数据仓库的信息进行决策分析。On-line Analytical Processing(在线分析处理或联机分析处理)就是一个应用广泛的数据仓库使用技术。它可以根据分析人员的要求,迅速灵活地对大量的数据进行复杂的查询处理,并以直观的容易理解的形式将查询结果提供给各种决策人员,使他们能够迅速准确地掌握企业的运营情况,了解市场的需求。
;第四章 联机分析处理(OLAP);4.1 OLAP概念;4.1.1 什么是OLAP;OLAP 的特点:
多维性 —— OLAP服务通过支持多维聚合路径(dimensional aggregation path)或层次结构和/或多重层次结构,提供了大量数据视图或多维的概念性视图。
容易理解 —— 为OLAP 分析设计的数据仓库或数据集市可以处理与应用程序和开???人员相关的任何业务逻辑和统计分析,同时使它对于目标用户而言足够简单。
交互性 —— OLAP帮助用户通过对比性的个性化查看方式,以及对各种 “what-if”数据模型场景中的历史数据和预计算数据进行分析,将业务信息综合起来。用户可以在分析中定义新的专用 计算,并可以以任何希望的方式报告数据。
快速 —— OLAP服务常常以多用户的客户机/服务器模式实现,而且无论数据库的规模和复杂性有多大,都能够对查询提供一致的快速响应。合并的业务数据可以沿着所有维度中的层次结构预先进行聚合,从而减少构建OLAP报告所需的运行时间。
;4.1.2 OLAP的相关基本概念;6. 多维数组
图4.1 按多维数组组织起来的三维立方体(multicube)
多维数组是维和变量的组合表示。一个多维数组可以表示为:维1,维2,…,维n,变量,比如:图4.1所示的商品销售数据是按时间、地区和产品组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(时间,地区,产品,销售额)。如果在图4.1的基础上扩展一个维“销售渠道”,就得到一个四维的结构。
7. 数据单元(单元格)
数据单元(单元格)是多维数组的取值。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值,比如:2004年3月,昆明,笔记本电脑,$80000。
;4.1.3 OLAP和OLTP的区别;4.1.3 OLAP和OLTP的区别;4.1.4 OLAP和数据仓库的区别;4.1.4 OLAP和数据仓库的区别;第四章 联机分析处理(OLAP);4.2 OLAP的基本操作;4.2.1 数据切片(SLICE);按照定义4.3,一次切片一定使原来维数减1,因此所得的切片结果并不一定是二维的“平面”,其切片结果的维数取决于原来的多维数组的维数。这样的切片定义不够通俗易懂,所以我们给出了切片的另一个定义(这两个定义是不等价的)。
定义4.4 选定多维数组中两个维:维i和维j,在这两个维上取某一区间或任意的维成员,而将其余的维都分别取定一个维成员的动作称为多维数组在维i和维j上的一个切片,表示为:(维i,维j,变量)。
;例4.2 对于例4.1,选定多维数组(时间,城市,产品,销售额)中的时间维度与产品维度,而在城市维上取定一个维成员(设为“上海”或“广州”),就得到了多维数组(时间,城市,产品,销售额)在时间和产品两维上的一个切片(时间,产品,销售额)。它表示“上海”或“广州”地区各产品、每年的销售情况。相应地,选定时间维度与城市维度,而在产品维上取定一个维成员(设为“电视机”或“电冰箱”),就得到了多维数组(时间,城市,产品,销售额)在时间和城市两维上的一个切片(时间,城市,销售额)。
从定义4.4可以得出两点:
1)一个多维数组的切片最终是由该数组中除切片所在平面的二个维之外的其他维的成员值确定的。
2)维是观察数据的角度,那么切片的作用或结果就是舍弃一些观察角度,使人们能在两个维上集中观察数据。因为人的空间想象能力毕竟有限,一般很难想象四维以上的空间结构。所以对于维数较多的多维数据空间,数据切片是很有意义的。
定义4.4可以看成是定义4.3的一个特例。对于一个n维数组,按定义4.3进行的n-2次切片的结果,就必定是对应于按定义4.4进行的某一次切片的结果。
;4.2.2 数据切块(DICE);4.2.3 数据上探/下钻(DRILL-UP/DRILL-DOWN);图4.4 上探、下钻操作示意图
显然,钻取的深度与维所划分的层次相对应。如果对时间维度上只定义了“年”、“季度”这两个层次关系,那么表2是我们能够得到的最细节的数据,不能
您可能关注的文档
- 师说系列2013年高考地理二轮复习ppt课件专题五选修部分第2讲 自然灾害与防治.ppt
- 师说2015-2016高中历史人教版必修1ppt课件第7课《英国君主立宪制的建立》.ppt
- 常州市武进区夏溪初级中学七年级生物下册123《感知信息》ppt课件苏教版.ppt
- 常慧五年级上册数学《组合图形面积》课件.ppt
- 师说系列2013年高考地理二轮复习(知识网络构建核心考点突破随堂训练)专题三 人文地理事象的形成和变化 第5讲 地域联系ppt课件.ppt
- 师说系列2013年高考地理二轮复习(知识网络构建核心考点突破随堂训练)专题三 人文地理事象的形成和变化 第3讲 农业ppt课件.ppt
- 常州市西夏墅中学高三语文复习ppt课件《祝福》(人教版).ppt
- 布丁HOUSE欢乐嘉年华主题营销活动策划方案精品推荐课件_1.ppt
- 平行四边形的面积《平行四边形的面积》课件龙波中心学校五年级上.ppt
- 常识熟悉因特网多媒体教学ppt课件演示文稿整理版.ppt
- 数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第7章.ppt
- 数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第6章.ppt
- 数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第5章.ppt
- 数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第9章.ppt
- 数据仓库与数据挖掘综述课件.ppt
- 数据仓库与数据挖掘课件6Classification and .ppt
- 数据仓库与数据挖掘课件9Mining Object Spatial and Multimedia .ppt
- 数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第8章.ppt
- 数据仓库与数据挖掘课件(精).ppt
- 数据仓库与数据挖掘课件(精)_1.ppt
文档评论(0)