- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chap4_1_联机分析处理(OLAP).ppt
联机分析处理(OLAP) OLAP 的基本概念 OLAP的多维数据分析 OLAP 的模型 OLAP工具评价 引例 在最近几年的一次股东会议上,百事可乐公司(PepsiCo,Inc)的首席执行官韦思·加洛韦(D. WayneCalloway)说:“10 年前,我可以告诉你们立体脆(Doritos)在密西西比州西部的销售情况。今天,我不但可以告诉你们立体脆在密西西比州西部销售得多么好,而且还可以告诉你们它们在加利福尼亚、在奥伦奇城、在欧文县以及每周四在本地Vons 超市第四通道的促销中销售得多么好。 OLAP 的基本概念 OLAP 的发展背景 联机分析处理是数据仓库系统的一个应用 OLAP 的发展背景 自 20 世纪80 年代开始,许多企业利用关系型数据库来存储和管理业务数据,并建立相应的应用系统来支持日常的业务运作。 这种应用以支持业务处理为主要目的,被称为联机事务处理(On-line Transaction Processing,OLTP)应用,它所存储的数据被称为操作数据或者业务数据 随着市场竞争的日趋激烈,企业更加强调决策的及时性和准确性,这使得以支持决策管理分析为主要目的的应用迅速崛起,这类应用被称为联机分析处理,它所存储的数据被称为信息数据 联机分析处理的概念最早由关系数据库之父 E.F. Codd 于1993 年提出。Codd 认为,联机事务处理已不能满足终端用户对数据库查询分析的要求,SQL 对大容量数据库的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量的计算才能得到结果,而查询的结果并不能满足决策者提出的需求 因此,Codd 提出了多维数据库和多维分析的概念 OLAP的多维数据分析 OLAP 的一些基本概念 理解数据立方 OLAP 的基本分析操作 OLAP 的一些基本概念 变量 维 维的层次 维成员 多维数组 数据单元(单元格) 变量 变量是数据的实际意义,即描述数据是什么。例如,数据 100 本身并没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量等。在一般情况下,变量总是一个数值度量指标,例如人数、单价、销售量等都是变量,而100 则是变量的一个值。 维 维是人们观察数据的特定角度。例如,企业常常关心产品销售数据随着时间的推移而产生的变化情况,这时是从时间的角度来观察产品的销售,所以时间是一个维(时间维); 企业也时常关心自己的产品在不同地区的销售分布情况,这时是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。其他还有如产品维、顾客维等。 维的层次 人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,称这多个描述方面为维的层次。 一个维往往具有多个层次,例如,在描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了地理维的层次 维成员 维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成的。 例如,考虑时间维具有日期、月份、年这3 个层次,分别在日期、月份、年上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日” 一个维成员并不一定在每个维层次上都要取值,例如“某年某月”、“某月某日”、“某年”等都是时间维的维成员。 对应于一个数据项来说,维成员是该数据项在某维中位置的描述。例如,对于一个销售数据来说,时间维的维成员“某年某月某日”就表示该销售数据是“某年某月某日”的销售数据,“某年某月某日”是该销售数据在时间维中位置的描述。 多维数组 一个多维数组可以表示为(维l,维2,……,维n,变量)。例如,若日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(地区,时间,销售渠道,销售额),如果在此基础上再扩展一个产品维,就得到一个四维的结构,其多维数组为(产品,地区,时间,销售渠道,销售额)。 数据单元(单元格) 多维数组的取值称为数据单元。当多维数组的各个维都选中一个维成员时,这些维成员的组合就唯一确定了一个变量的值。那么数据单元就可以表示为(维1 维成员,维2 维成员,……维n 维成员,变量的值)。 例如,在产品、地区、时间和销售渠道上各取维成员“牙膏”、“上海”、“1998 年12 月”和“批发”,就唯一确定了变量“销售额”的一个值(假设为100 000),则该数据单元可表示为(牙膏,上海,1998 年12 月,批发,100 000) 理解数据立方 用于 OLAP 的数据是多维的。图4.2即为从购买地区、购买时间和产品名称等3 个视角来分析购买订单时需要的一种数据立方。 数据立方又称多维数据集,是用来分析
文档评论(0)