-2维度建模补充祥解.pptVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3.4 促销维度 2.3.5退化的事务编号维度 退化维度(Degenerate Dimension) POS编号属于固有操作性事务编号,它表示了父实体的惟一标识符。它在星型模型中仍旧有用,可作为主关键字而将单个事务中售出的所有产品集中起来。 类似的退化维度还有:订单编号、发票编号与提货单编号等。 2.6.1 雪花处理 优势:节省空间,规范化设计维护起来容易一些。 缺点: 数据展示复杂化 链接说明的复杂性增加了优化器在次要方面开销过大以及选取抵消算法策略的机会。 雪花化节省下的少量磁盘空间是无关紧要的。 降低了用户在维度中进行浏览的能力 雪花处理挫败了对位图索引的使用。 2.6.2维度过量使用——蜈蚣 大多数业务处理够可以在事实表中用个数少于15的维度表示出来,如果存在25个以上维度,就应该想办法将相关维度组合成单个维度。 2.7 代理关键字(Surrogate Keys) 代理关键字:填充维度时按需要而顺序分配的整数值。 数据仓库中,维度和事实表之间的每个链接够应该用没有明确含义的整型代理关键字来建立。应该避免使用自然的操作型产品编码。 没有一个数据仓库关键字是意义隐晦的,想通过看一下关键字就能直接知道它所表达的行方面信息是行不通的。 代理关键字允许数据仓库团队维持对环境的控制,而不会受到产品编码生成、更新、删除、再生与重用等操作性规则的妨碍。 部分操作型编码会在废弃一段时间后再投入使用,另外,代理关键字允许数据仓库团队对来自多个操作性源系统的数据进行合并,即使他们之前缺乏一直的源关键字也无所谓。 整型的代理关键字编码往往小于操作型编码,较小的代理关键字转化成较小的事实表、较小的事实表索引以及事实表行。 对于缺少操作性编码方案的情况,可以分配一个代理关键字来表示。 日期维度的“代理关键字” 支持“日期待定” 1月1日——12月1日——32 将代理日期关键字处理成日期序号,可以允许事实表在日期关键字基础上进行物理分区。 代理关键字在渐变维度中的应用。 * Day Number in Epoch:纪元日编号 Day Number in Calendar Month:日历日期编号 Day Number in Fiscal Month:财政月日编号 Selling Season:销售旺季 Major Event:重大事件 维度建模 补充内容 数据仓库工具箱——维度建模的完全指南(第二版) [Ralph Kimball, Margy Ross] 数据仓库生命周期工具箱:设计、开发和部署数据仓库的专家方法 [Ralph Kimball, Laura Reeves,Margy Ross,Warren Thornthwaite] 电子工业出版社 1.4.1事实表 事实表是维度模型的基本表 应力图将从一个业务处理过程得到的度量值数据存放在单个数据中心 维度值的类标给出了事实表的粒度定义,并确定出度量值的取值范围是什么。 事实表的一行对应一个度量值。一个度量值就是事实表的一行。事实表的所有度量值必须具有相同的粒度。 不能将冗余的文本信息存放在事实表内。 除非文本对于事实表的每行来说都是唯一的,否则它必须归属到维度表中。 事实表通常要占据维度数据库消耗的整个空间的95%或更多。 在维度模型中,事实表表示维度间多对多的关系。 以粒度划分事实表 事务粒度事实表(Transaction Grain Fact Table) 一条记录代表了业务系统中的一个事件。 事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。? 周期快照粒度事实表(Periodic Snapshot Grain Fact Table) 记录有规律的,可预见时间间隔(每天、每周等)的业务累计数据。(如库存日快照事实表)。日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些聚集事实值。事实表的数据一旦插入即不能更改,其更新方式为增量更新。 累积快照粒度事实表(Accumulating Snapshot Grain Fact Table)。 涵盖一个事务的生命周期内的不确定的时间跨度。(如具有多个日期字段的发货事实表。) 累积快照粒度事实表(详) 完全覆盖一个事务或产品的生命周期的时间跨度,它通常具有多个日期字段,用来记录整个生命周期中的关键时间点。另外,它还会有一个用于指示最后更新日期的附加日期字段。 由于事实表中许多日期在首次加载时是不知道的,所以必须使用代理关键字来处理未定义的日期,而且这类事实表在数据加载完后,是可以对它进行更新的,来补充随后知道的日期信息。 订货日期 预定交货日期 实际发货日期 实际交货日期 数量 金额 运费? ?记录的是购买货物的整个生命周期的数据,记录第一次产生

文档评论(0)

基本资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档