- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维度建模
》前情回顾
数据仓库的概念
数据库与数据仓库
④
数据仓库结构
Q数据仑库特点
数据仓库模型
数据仓库工具Hive
目录
维度建模设计
维度表技术基础
的主要流程
01
02
0304
05
维度建模简介
事实表技术基础
维度模型的误区
01
维度模型简介
维度模型简介
维度建模被广泛接受为数据分析的首选技术,因为它同时满足了两个需求
向业务用户交付可以理解的数据
提供快速查询性能
》维度建模是使数据库变得简单的一项长期技术。在数次案例之后,∏组织、咨询人员和业务用户都
自然而然地倾向于一个简单的维度结构,以满足人们对简单性的基本需求。简单性是至关重要的
因为它确保了在用户能够轻松地理解数据的前提下允许软件快速地导航和传递结果。
·例如,一位管理人员描述她的业务:“我们在不同的市场销售产品,并随着时间来衡量我们
的业绩。维度设计师遵从产品、市场和时间的重点进行模型设计。
维度建模方法
维度建模
·适合表连接以及聚合计算的
查询请求;
易用,易理解,查询效率高
更适合作为分析型应用
(OLAP、BI)的基础
实体建模
第三范式(3NF)建模
适用于频繁的 Update, insert
抽象客观世界的方法,局限
种(事务型应用)
于业务建模和领域概念建模
·规范化模型过于复杂,无法得
到直观的、高性能的数据检索
》星型模型
维度建模是数据仓库建设中的一种数据建模方法。 Kimba‖最先提岀这-概念。其最简单的
描述就是,按照事实表,维度表来构建数据仓库,数据集市。这种方法被人广泛知哓的名字
就是星型模式(Star- schema)
部门维
地域维
剖门键
也域键
国家省份城市
省份
BB
CD
代理处
A
地域建
时间维
星型模式之所以广泛被使用,在于针对各个维作
销售数量
销售金额
了大量的预处理,如按照维进行预先的统计、分
产品
产品售价
类、排序等。通过这些预处理,能够极大的提升
产品质量
数据仓库的处理能力
图1星型模型
》星型模型
当星型模型的维度表进一步层次化,就形成了雪花模型。
门维
国家锥
地域维
地域
国家名称
部门键
雪花模型的优点是:通过
最大限度地减少数据存储
省份名称
时间键
量以及联合较小的维表来
剖门键
时间
改善查询性能。也就是去
销售数量
除了数据余。
销售金额
产品描述
产品售价
产品质量
图2雪花模型
维度建模的优点
围绕业务
模型
直观
不需要抽
象处理
反应业
务问题
维度建模缺点
由于在构建星型模式之前需要进行大量的数据预处理,因此
会导致大量的数据预处理工作。
当业务发生变化,需要重新进行维度的定义时,往往需要重
新进行维度数据的预处理。而在这些预处理过程中,会导致
大量的数据冗余。
》如果只是依靠单纯的维度建模,不能保证数据来源的一致性
和准确性。
》在数据仓库的底层,不是特别适用于维度建模的方法。
文档评论(0)