- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第2-1章数据仓库设计——维度建模
1数据仓库的数据模型分类2维度模型的相关概念3维度模型的结构
2.1数据仓库的数据模型分类
2.1数据仓库的数据模型分类维度模型范式模型DataVault模型Anchor模型
2.2维度模型的相关概念
RalphKimball,数据仓库方面的知名学者,毕业于斯坦福大学。他创立的维度建模方法论(或Kimball方法论)已经成为决策支持领域的金科玉律。该方法非常直观,紧紧围绕业务模型,不需要经过特别的抽象处理,即可完成维度建模。
2.2.1粒度(Granularity)粒度是指数据仓库中数据单元的详细程度和级别,确定数据仓库的粒度是设计数据仓库的一个最重要方面。数据越详细,粒度越小级别就越低;数据综合度越高,粒度越大级别就越高。例如,地址数据中“北京市”比“北京市海淀区”的粒度大。
2.2.2维度(Dimension)和维度表维度(简称为维)是指人们观察事物的特定的角度,概念上类似于关系表的属性。例如企业常常关心产品销售数据随着时间推移而变化的情况,这是从时间的角度来观察产品的销售,即时间维;企业也常常关心本企业的产品在不同地区的销售分布情况,这是从地理分布的角度来观察产品的销售,即地区维。存放维数据的表称为维表,如下表所示就是一个时间维表。维表中的数据具有维层次结构,包含维属性和维成员。编号日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年
2.维属性和维成员一个维是通过一组属性来描述的,如时间维包含年份、季度、月份和日期等属性,这里的年份、季度等称为时间维的维属性。维的一个取值称为该维的一个维成员,如果一个维是多层次的,那么该维的维成员是在不同维层次的取值组合。例如,一个时间维具有年份、季度、月份、日期四个层次,分别在四个层次各取一个值,就得到时间维的一个维成员,即某年某季某月某日。编号日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年
3.维层次同一维度可以存在细节程度不同的各个值,可以将粒度大的值映射到粒度小的值,这样构成维层次(或维层次结构)或概念分层,即将低层概念映射到更一般的高层概念,概念分层允许在各种抽象级审查和处理数据。
例如对于地点维,有“杭州→浙江→中国”的维层次。又例如时间维,可以从年、季度、月份、日期来描述,那么“年份→季度→月份→日期”就是维层次。时间维维属性2014二季度2014年4月2014年4月25日维成员维层次
2.2.3度量(Measure)或事实(Fact)度量是数据仓库中的信息单元,即多维空间中的一个单元,用以存放数据,也称为事实(Fact)。通常是数值型数据并具有可加性。例如:(日期,商品,地区,销售量,销售金额)其中,销售量、销售金额就是两个度量。事实表时间维键顾客维键地区维键商品维键销售数量销售金额(元)111111500122225000133312800144437500
2.2.4多维数据集数据仓库和OLAP服务是基于多维数据模型的,这种模型将多维数据集看作数据立方体(DataCube)形式。多维数据集可以用一个多维数组来表示,它是维和度量列表的组合表示。一个多维数组可以表示为:(维1,维2,……,维n,度量列表)
某商店销售情况表按多维数组组织起来的三维立方体增加顾客维度后,按四维数组组织起来的多维立方体
2.3维度模型的结构
多维数据模型简洁、面向主题的由维度表和事实表组成直观的展示数据组织形式,利于数据的访问常见的多维数据模型有三种结构:星型模型、雪花模型、事实星座模型
1)星形模型星形模型(Starschema)是由一个事实表和一组维表组成,每个维表都有一个维主键,所有这些维组合成事实表的主键,换言之,事实表主键的每个元素都是维表的外键。该模式的核心是事实表,通过事实表将各种不同的维表连接起来,各个维表都连接到中央事实表。(1)星形模型的基本结构
星形模型的基本结构如下:
【例2.1】一个“销售”数据仓库的星形模型如图2.5所示。该模式包含一个中心事实表“销售事实表”和4个维表:时间维表、销售商品维表、销售地点维表和顾客维表。在销售事实表中存储着四个维表的主键和两
您可能关注的文档
- 基础素描- 课件 第1--3章 素描概略; 素描石膏几何体集合写生; 素描静物像写生.pptx
- 基础素描- 课件 第4--6章 素描人物肖像写生; 素描人物半身像写生; 素描的风格与表现性语言.pptx
- 数据仓库原理与实践 课件 第1章 数据仓库概述.pptx
- 数据仓库原理与实践 课件 第3章 数据仓库设计.pptx
- 数据仓库原理与实践 课件 第4章 数据仓库技术架构.pptx
- 数据仓库原理与实践 课件 第5章 数据集成与存储.pptx
- 数据仓库原理与实践 课件 第6章 数据仓库工具Hive.pptx
- 数据仓库原理与实践 课件 第7章 基于Spark平台的数据计算.pptx
- 数据仓库原理与实践 课件 第8章 任务调度.pptx
- 数据仓库原理与实践 课件 第9章 OLAP联机分析处理.pptx
文档评论(0)