07 Dimensional Modeling 1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
07 Dimensional Modeling 1

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 促销维度的设计(2/6) 存在多种不同的促销形式 降价,广告,展销,优惠卷,…… 每一种类型的促销活动可以单独形成一个促销维度表,也可以将所有的促销活动揉合在一个促销维度表中(右图) 促销关键字(PK) 促销名称 减价类型 促销媒体类型 广告类型 展览类型 优惠卷类型 广告媒体类型 展览提供者 促销价 促销起始日期 促销结束日期 …… * 促销维度的设计(3/6) 维度的组合: 参与组合的维度高度相关,组合起来的维度就不会比分开的维度大许多 组合起来的维度能够高效地进行浏览 维度的分散: 在用户分开考虑时,分开的维度更加容易理解 独立维度的管理对于组合维度来说,更加直截了当 * 促销维度的设计(4/6) 不在促销范围之内的商品销售事实如何在事实表中表示? 在促销维度表中定义一个特殊的 ‘行’ 在事实表中,所有没有参与促销活动的行(产品销售事实)都引用该特殊的 ‘行’,以表示该维度值对事实表中的当前行不可用 * 促销维度的设计(5/6) 在商品促销效果分析中,还有一类问题是上述的零售营销模型无法回答的: 什么样的促销产品还没有卖出去? 需要另外一个非事实型事实表来记录每天每件商品的促销活动 促销范围事实表 不存在度量指标 为每 天 中每个 商场 的每个 促销 产品 创建一行 * 促销维度的设计(6/6) 粒度不同 * 退化维度 维度表为空,具体的维度值直接存放在事实表中 事务编号 订单编号 发票编号 提货单编号 …… * 零售实例的多维模型 事实表 销售量,销售额,成本额,毛利润金额 维度表 日期,商场,产品,促销 退化维度:POS事务编号 在零售多维模型上的数据访问 通过维度表中的维度属性访问事实表 * * 模型的演化 新的维度属性 产品的全新描述属性 加入时间点前的,使用“不可用”进行填充 新的维度 会员、店员、日间时间等分析的新角度 新的维表 在事实表中填加新的外关键字 新的度量值事实 添加新的度量值属性 需要考虑事实表粒度 * 模型的演化(续) 维度变得具有更多的粒度性 建立新粒度层次上的维度表 可能带来新粒度层次上的事实表,从而需要同时建立新的维度表和事实表 全新的数据源的加入,会同时牵涉现存的维度和不能预见的新维度 新数据源几乎总是拥有自己的粒度和维度 建立新的事实表和维度表 * 事实表的粒度设计将影响到是否易于加入新的维度。 * 维度的规范化处理(1/2) 规范化 非规范化 雪花模型 星型模型 复杂的表关系 简单的表关系 节省存储空间 记录之间存在数据冗余 连接的复杂,高开销 连接简单,低开销 低维度浏览能力 高维度浏览能力 不支持物理加速技术 支持物理加速技术 * 维度的规范化处理(2/2) * 避免维度使用过多 * 维度表中关键字的设计 代理关键字,避免直接使用操作型数据作为维度表和事实表的主关键字和外关键字 可以缓冲操作型数据的变化对数据仓库数据的影响 性能优势 操作型数据可能无法作为关键字 日期维度的特殊要求 历史一致性 产品维度表 产品关键字(PK) 产品描述 SKU编号(自然关键字) 商标描述 分类描述 部门描述 …… * 日期维度的特殊要求 SQL日期不能为“日期待定”或“日期不可用” 日期维度的代理关键字应当按照有意义的连续次序进行分配 允许在日期关键字基础上进行物理分区和索引 1月1日-1,1月2日-2,2月1日-32 YYYY-MM-DD,是不合适的做法 * 市场篮子分析(1/2) 不使用OLAP或者数据挖掘工具 事实表的抽取 从零售营销事实表中抽取形成新的事实表,以实现新的分析应用 例:商品促销活动实施效果分析 * 移 植 粒度=1行/POS事务分列项 粒度=1行/商场每天促销卖出的每对产品 图2.14 从购买事务移植的市场篮子事实表 * 市场篮子分析(2/2) N个产品,N*N种组合 解决方式 领域知识支持 层次式的分析 类别(25×25) 商标(500×500) …… 产品(10000×10000) * * * * * * * * * * * * * 多维建模 Dimensional Modeling Institute of software, Nanjing University Fall, 2008 Bei Jia * 多维建模 多维建模初步 多维建模案例一,零售营销 多维建模案例二,库存管理 多维建模案例三,订单管理 多维建模案例四,客户关系管理 * 维度建模中的基本概念 事实表 维度表 事实与维度的融合 星型模型 雪花模型 数据立方体 * 事实表 是维度建模的核心和基本表 每一事实表都对应着一个或若干个‘度量值’ 度量

文档评论(0)

mydoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档