- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
05 数据仓库 第十章 维度建模的原则
Chapter Ten维度建模的原则 Chapter Ten 维度建模的原则 目标 理解需求定义如何影响数据设计 星型模式的基础知识 找出事实表以及维度表中的内容 数据仓库中应用星型模式的好处 Chapter Ten 维度建模的原则 Contents 从需求到数据设计 星型模式 星型模式的键 星型模式的优势 从需求到数据设计 需求的定义完全驱动着数据仓库的数据设计。 需求定义文档 信息包表包括: 商业指标 商业维度 维度内的层次结构 信息包表是数据仓库逻辑数据设计的基础 数据设计就是集中所有的数据结构 一个数据结构是由一组数据元素结合而成的。 逻辑数据设计包括: 决定多种需要的数据元素以及将这些元素组合成数据结构 数据结构之间建立关系 从需求到数据设计 设计决策 选择处理过程:信息包表的主题 选择粒度:数据到底详细到什么程度? 识别维度: 信息包表 选择事实 选择数据库的持久度:保存多旧的历史数据? 从需求到数据设计 维度建模基础 维度建模:将所需的商业维度合并到逻辑数据模型中去。 信息报表是维度建模的基础:三类数据实体 指标或度量单位 商业维度 商业维度的属性 例: 从需求到数据设计 维度建模基础 Example:将所有的信息集成在一起,显示了如何由信息包表构造不同的维度表(就是关系、表) 从需求到数据设计 维度建模基础 我们已经通过信息包表构造了事实表和维度表。 问题: 这些表在维度模型中如何安排? 他们在模型中的关系如何? 如何标记这些关系? 查询和分析有那些类型? 通过多个维度表的维度属性,查询事实表中的指标就是典型的查询与分析。 例:查询2000年版本的Cherokee、在2001年1月份ABC经销商卖出的、客户已婚、并通过建行提供的三年贷款。符合以上条件的交易有多少销售收益? 需要通过多个维度表中的属性分析所有这些事实。 一个查询中会用到每个商业维度表的部分或者全部属性。 从需求到数据设计 维度建模基础 这些表在维度模型中如何安排?前提: 模型应该为数据访问提供最好的方式 这个模型必须以查询为中心 它必须为查询和分析而接收优化 模型必须显示出事实表和维度表之间的相互作用 这个结构必须使每个维度都能有相等的机会与事实表交互 模型应该允许沿着维度的层次结构下钻或上钻 分析前提,将事实表放在中央,维度表安排在事实表的四周能够满足这些要求。 事实表位于星型中央,维度表分布在星型的各个角上——星型模式 从需求到数据设计 维度建模基础 汽车销售商的星型模式 从需求到数据设计 维度建模基础 ER建模与维度建模的比较 OLTP中常用ER建模 数据一致性、较小的冗余性 适用于回答交易层面上的问题 一个OLTP系统是通向微观交易的窗口 DW中则采用维度建模 DW关注的是经理如何管理业务问题 DW回答全局的问题 反映商业趋势 通过几个商业维度,衡量业务情况 Chapter Ten 维度建模的原则 Contents 从需求到数据设计 星型模式 星型模式的键 星型模式的优势 星型模式 构建星型模式是数据仓库建模的基本数据设计技术。 星型模式 一个简单的星型模式的回顾 星型模式 维度表的内容:维度表的集合是星型模式中的关键部分 维度表键:唯一的确定表的每行 大量的属性:维度表很宽 文本属性(很少有计算的数值数据)描述性的信息。用户使用此描 述构造他们的查询。 非规范化:规范化意味着更多的表,为了高效查询,查询最好直接从维度表中获得一个属性,然后直接查询事实表 具有上钻下钻的能力:local 多级层次结构:满足不同用户不同的 钻取结构(各部门的层次划分的不一致性) 更少的记录:相对事实表而言,维度是描述、限制和约束 星型模式 事实表的内容 事实表是我们存放指标的地方 保存级别尽可能低的细节数据 仅包含汇总的数据:聚集事实表 星型模式 事实表的内容 星型模式 不含事实的事实表 一种特殊的情况 当事实表表示事件的时候 Example:需要用“1”表示出勤了么?No 星型模式 数据粒度 粒度表示的是事实表中细节数据的详细程度 最低粒度 事实表的基本层次是所有相应维度自然的最低层次。 例:产品、日期、客户、销售代表为4个维度,则:事实表中必须保存:单独的产品、特定的日期、特定的销售代表和特定客户 一条记录 使用最低粒度的好处 可以频繁容易的从操作型系统抽取数据 很多数据挖掘需要最低层次 便于向下钻取 使用最低粒度的缺点 存储和维护的代价 实际处理中,我们构建汇总事实表来支持汇总数据查询 Chapter Ten 维度建模的原则 Contents 从需求到数据设计 星型模式 星型模式的键 星型模式的优势 星型模式的键 主键 维度表的每行都可以由维度表中的主键唯一地进行识别。 维度表中的候选键 使用OLTP系统中的主键行么
您可能关注的文档
最近下载
- 人教版(2024)七年级上册生物全册集体备课教案 .pdf
- YYT 1789.4-2022 体外诊断检验系统 性能评价方法 第4部分:线性区间与可报告区间.docx VIP
- 江西省临川第一中学2024-2025学年高一上学期开学考试历史试题(解析版).docx VIP
- 2023年汕头市投资控股集团有限公司人员招聘考试题库含答案解析.docx VIP
- 一种凝汽式汽轮机低压缸效率的在线计算方法.pdf VIP
- 口腔名词解释、大题.pdf VIP
- 《革命烈士诗抄》阅读试题及答案.docx VIP
- 招标代理投标文件.doc VIP
- 2022年汕头市投资控股集团有限公司校园招聘考试笔试试题及答案解析.docx VIP
- 2024年四川宜宾初中学业水平考试数学试卷真题(含答案详解).doc VIP
文档评论(0)