- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库维度建模
学习目的
在课程结束后应该知道:
■ 数据仓库维度建模分哪几个步骤?
■ 每个步骤都有哪些原则,和哪些误区?
・ 掌握维度建模方法?
■ 维度表属性在维度模型中起到什么样的作用
■ Kimball极力反对哪些建模方法?
一个比喻 ______ ESENSOFT
♦ 比喻:
・ 如果将数据仓库建设看作是一个高楼大厦建造过程的
话
・ 数据仓库维度建模就是大厦的框架建设工作
■ 数据仓库ETL过程,就是为大厦添砖加瓦的过程
■ 优秀数据访问工具则是大厦整体装修的最佳工具
♦:♦框架的重 性
■ 地基打多深决定大厦能做多高。
■ 钢筋混凝土结构还是刚结构决定了大厦的稳定性
・ 维度建模是数据仓库框架建设的重 技术
维度建模四步曲 ESENSOFT
♦:♦四步维度建模步骤:
・ 1 .选取 建模的业务流程
■ 2.定义业务流程中的数据粒度
・ 3.选定用于每个事实表行的维度
■ 4.确定用于形成每个事实表行的数字型事实
四步曲一 1.选取业务流程 ESENSOFT
♦:♦误区:
■ 不针对业务流程而针对业务部门进行维度建模
■ 将注意力放在业务部门身上,而不关注业务流程
■ 为某个部门建立单独的维度模型
♦:♦原则:
・ 针对业务流程进行维度建模
・ 确保某个业务流程中的核心数据只被抽取一次
■ 保证数据仓库中业务数据一致性
四步曲一2 .定义粒度(1)
♦ :♦粒度的解释:
・粒度传递了同事实表度量值相联系的细节所达到的程
度方面的信息。
■简单的说,反映了事实表的明细程度
♦:♦粒度举例:
■ 超市小票上的购物清单
■ 医生的处方药品清单
■ 仓库每种产品库存值的月快照
♦:♦误区:
■数据仓库团队经常绕过这个看似不必要的步骤
・一个不合适的粒度定义将会使维度建模感觉无从下手
四步曲一2 .定义粒度(2)
♦ :♦原则:
■ 优先考虑具有原子粒度的业务信息,这些数据不能再
做进一步的细分
■ 数据仓库中存储汇总的、概 性的数据主 是基于数
据库性能上的考虑
・ 汇总数据不能成为最底层细节数据的替代品
四步曲一3.选定维度 ESENSOFT
♦ :♦误区:
■没有定义粒度就开始选定维度
♦:♦原则:
■在粒度确认后,选取能从各个角度,充分描述问题的
维度
为每个维度添加丰富的维度属性
♦示例:
■常见维度包括日期、产品、顾客、事务类型和状态
四步曲一4 .确定事实
♦:♦误区:
■没有第2步的粒度确认,就开始确定事实
■将含有不同粒度的事实放在了同一个事实表中
♦:♦原则:
■ 确定用于形成每个事实表行的数字可加型事实
■ 在需求调研时我们可以通过提出“您需 对哪些指标
进行统计? ”这样的问题来确定事实。
■ 具有不同粒度的事实必须放在不同的事实表中
■ 事实一般在各维度上都有良好的可加性
四步曲一总结
♦ :♦维度建
原创力文档


文档评论(0)