08DimensionalModeling2.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * 数据仓库总线结构(3/3) 通过设计出一整套在企业范围内具有统一解释的标准化维度与事实,从而可以对企业数据仓库的建设任务进行合理的分解,由不同的开发小组分阶段,或并行地进行数据仓库的建设。 采用总线体系结构可以独立于技术手段和数据库平台 * 数据仓库总线矩阵(1/2) 公共维度 业务处理 日期 产品 商场 促销 仓库 厂家 合同 发货人 零售营销 x x x x         零售库存 x x x           零售交货 x x x           仓库库存 x x     x x     仓库交货 x x     x x     购买订单 x x     x x x x * 数据仓库总线矩阵(2/2) 矩阵的行:对应着数据集市 如果数据来源不同,处理功能不同,或者矩阵行代表的内容无法在单个迭代过程中合理完成,就应当创建独立的矩阵行 矩阵的列:对应着共享的公共维度 * 数据集市(1/2) 一级数据集市 (first-level data marts) 基于单一数据源系统的数据集市 ETL的设计相对简单 合并数据集市 (consolidated data marts) 跨越业务处理过程的多源数据集市 ETL的设计相当复杂 如果基于一组共享的公共维度来建立若干个独立的一级数据集市,那么也可以在已有的一级数据集市上来建立合并数据集市。 * 数据集市(2/2) 合并数据集市主要供企业高层用户做数据分析与决策支持。 利润率的计算 投资-收益分析 * 一致性维度(1/6) 一致性维度是进一步开发总线结构数据仓库系统的基础 一致性维度 要么是同一的,要么是具有最佳粒度与细节性的维度在严格数学意义上的子集 一致的维度具有如下特征 一致的维度关键字 一致的属性列名字 一致的属性定义 一致的属性值 * 一致性维度(2/6) 一致的维度可能意味着是相同的维度表 与它们相连的事实表具有完全相同的内容(不同的度量值)。例如: 连接到销售事实表与库存事实表上的日期维度表是同一的,意味着销售事实表和库存事实表中的内容是相同的 这样的维度表在物理上可能是同一张表,也可能是不同的表,但它们应该具有相同数目的行、相同的关键字值、相同的属性标签、相同的属性定义与相同的属性值。 * 一致性维度(3/6) 大多数一致的维度是在可能的最佳粒度层次(最细粒度)上定义的。 顾客维:单个顾客 产品维:用以对产品进行跟踪的最低层次 日期维:天 * 一致性维度(4/6) 原子型维度 在最佳粒度层次上的维度定义(最小的粒度) 上钻维度/堆积维度 (roll-up dimensions) 在较高层次上的维度定义(较大的粒度),用以连接较高层次的事实表 日期维表(连接每日快照) vs. 周维表(连接每周快照) 如果堆积维度是基本层次上原子型维度严格意义上的子集,则堆积维度与原子型维度保持一致 * 一致性维度(5/6) 不同业务处理的事实粒度不同 产品维度 vs. 商标维度 * 一致性维度(6/6) 两个处于相同细节层次上的维度表,如果它们均是另一个维表的子集,则它们也是一致的 全体产品维度 家用产品 服装产品 公同属性 * 一致性事实(1/2) 同样的事实在不同的数据集市进行存储的一致性 取值单位的一致性 值的一致性 自然关键字的一致性 * 一致性事实(2/2) 一般说来,事实表数据不在多个数据集市明确的进行拷贝。 如果事实表存在于多个数据集市,那么支撑这些事实的定义和方程必须都是相同的 如果无法使事实完全保持一致,那么应该对不同的解释给与不同的名称 * * * * * * * * * * * * * * * * * * * 多维建模 Dimensional Modeling Software Institute, Nanjing University Bei Jia * 多维建模 多维建模初步 多维建模案例一,零售营销 多维建模案例二,库存管理 多维建模案例三,订单管理 多维建模案例四,客户关系管理 * 库存管理维度模型 内容 用于大型杂货连锁店营销事务的维度模型 主要概念 值链 三种事实表模型:周期快照,事务,累积快照 半加型事实 增强型库存事实 数据仓库总线结构与矩阵 一致性维度与事实 * 值链 (1/2) 由企业的关键业务组成 值链确定了企业主体活动的自然逻辑流程 * 值链(2/2) 其中的每一步业务处理都将产生大量的周期性事务记录(来自企业自身的业务处理系统) 决策支持系统的首要目标是监控关键处理过程的性能结果 其分析的依据是来自于每一步业务处理过程的事实表 从每一步业务处理过程的业务数据库中可以衍生出一个或多个事实表 * 事实表粒度模型 三种互补的库存事实表粒度模

文档评论(0)

kaiss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档