数据仓库5联机分析处理技术2.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5讲 联机分析处理技术2;多维数据模型构成的多维数据空间称作为数据立方体(Data Cube,简记为cube)。 是从不同角度对同一数据进行观察得到的数据交点。;一个二维数据立方体对应的某地区商店销售额表;商店销售额表的三维数据立方体 ;维是观察数据的特定角度,是每个事物的属性。 每个维都有一个唯一的名字,如:时间维、地区维、产品维等。;维成员(member) 维由一些维成员构成。维的一个取值称为维的一个成员。如果维已经分成了若干个维层次,那么维成员就是不同维层次取值的组合。;维层(level) 人们观察数据时,除了要从某一个角度去观察外,还需要从不同的细节程度去观察,这些不同的细节程度就称为不同的维层次。 如:销售地区维有分区、省、市,对于时间维有日、月、季度。;维层次(hierarchy) 在一个维中可以有多种分类方法,把每种分类方法叫做一个层次。 如:时间维的两个层次。;维属性(attribute) 维属性说明维成员所具有的特征。 如:在地区维的商店这一层定义“负责人”、“商店类型”等属性,在城市层上定义“人口”、“面积”等属性。;度量是要分析的目标或对象,是多维数据集的核心值,是最终用户在数据仓库应用中需查看的数据。 常见的度量有:销售量、供应量、营业额等。 通常是具体数据值。;;1.星形模型;1.星形模型;2.雪花模型;4.3 多维分析操作 4.4 多维查询语言;关系数据模型的核心概念是关系,基本操作是:选择、投影、链接。 多维数据模型结构复杂,操作的种类也相对较多。 常用的多维分析操作有:切片、切块、旋转、下钻、上卷;聚集是对细节数据进行综合的过程,是多维分析的基础。 最常用的5种聚集函数: 求和 计数 求最大值 求最小值 求平均值;举例:零售商对产品的销售分析时,设置了时间维(Time)、地区维(Store)和商品维(Product),度量是销售额(Sales),其中该地区维是指商店所在地区。 假设数据仓库中有一张销售表(如下图),只列出在时间T1、商品P1在济南地区的商店(S1、S2、S3)的销售额,分别为:(T1,S1,P1:100),(T1,S2,P1:78),(T1,S3,P1:97);;如何获得济南地区在时间T1对商品P1的销售额?即如何获得数据单元(T1,“济南”,P1:X) 即:X=sum(100,78,97);分布型聚集函数 将数据分成n份,对其中的每一份应用该函数,可以得到n个聚集值,对这n个聚集值进行计算得到的结果如果和整个数据(不划分)应用该函数得出的结果一致,则称该函数是分布型的。 count、sum、min、max ;代数型聚集函数 如果一个函数可以由若干个分布型函数进行代数运算得出,则说该函数是代数型。 Avg=sum/count ;整体型聚集函数 如果一个函数不能由其它函数进行代数运算得出,则称其为整体。 Median、rank 在计算时,需要同时得到所有的数据,需要消耗较多的资源,有较大的计算代价。 ;多维分析操作是指对数据立方体执行切片、切块、旋转、下钻、上卷等各种分析操作,剖析数据,使用户能从多角度、多侧面观察数据库中的数据,从而深入了解包含在数据中的信息和内涵。;1. 切片(Slice);;2. 切块(dice);定义:改变数据立方体维的次序的动作。 ;3. 旋转(rotate);举例:旋转前的维方向;旋转后的维方向(不同维度间的旋转操作) ;旋转后的维方向(维度层次上的旋转操作) ;定义:是指在某一个分析过程中,用户可能需要从更多的维或者某个维的更细层次上来观察数据的操作。;定义:是与下钻操作相反的操作类型。是指为了看到更粗的数据的操作过程。 ; ;除上述几种常用多维分析操作以外,包有:维操作、属性操作等。 ;维是多维数据模型中的核心概念。 一个维中又包含有:层次、层和成员。 ;维的操作 给定维标识求维名字;给定维名字求维标识;求一个维中成员的个数。 给定层次的标识或名,求层次中的所有层。 给定层标识或名字,求层中成员的个数;;举例:结合下图,以时间维为例,给出的一些典型操作。 求时间维中的成员个数:时间.counts,其中此处counts是操作符。 求“2月份”的父成员:时间.年 .季度.月.2月份.parent,得到的结果将是:时间.年 .季度.第1季度。;目的:按照成员的属性进行特征分析。 成员属性:用于进一步说明成员的特征。 属性操作:丰富了多维数据分析,使得不仅可以根据层次进行操作,而且还可以按成员的属性进行特征分析。 举例:商品维的层次为商品代码(ArticalID)→Family→Group→Area→Top(如表4.5),商店维的层次为(ShopID)→City→Region→Country→Top(如表4.6); ;其中:CAMC的Video在

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档