- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章数据仓库开发模型 在创建数据仓库之时,需要使用各种数据模型对数据仓库进行描述。数据仓库的开发人员依据这些数据模型,才能开发出一个满足用户需求的数据仓库。使开发人员能够将注意力集中在数据仓库开发的主要部分。模型有更好的适应性,更易于修改。当用户的需求改变时,仅对模型做出相应的变化就能反映这个改变。 数据仓库开发模型 2.1数据仓库开发模型 2.2数据仓库概念模型 2.3数据仓库逻辑模型 2.4数据仓库的物理模型 2.5数据仓库的元数据模型 2.6数据仓库的粒度和聚集模型 练 习 2.1 数据仓库开发模型 模型是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。 数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂——元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。 2.2 数据仓库概念模型 2.2.1 概念数据模型 数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据。 数据仓库的数据模型扩充了关键字结构,增加了时间属性作为关键字的一部分 数据仓库的数据模型中还增加了一些由基本数据所导出的衍生数据,这些导出的衍生数据主要用于对企业的管理决策进行分析 指标实体(事实实体) 2.2.2 规范的数据模型 2.2.3 星型模型 2.2.4 雪花模型 2.3 数据仓库逻辑模型 2.3.1 事实表模型设计 2.3.2 维模型设计 2.4 数据仓库的物理模型 2.4.2 数据仓库物理模型的索引构建 2.4.2 数据仓库物理模型的索引构建 2.4.2 数据仓库物理模型的索引构建 2.4.3 数据仓库物理模型的优化问题 2.5 数据仓库的元数据模型 2.5.2 元数据在数据仓库中的作用 2.5.3 元数据的收集 2.6 数据仓库的粒度和聚集模型 2.6.1 数据粒度的划分 2.6.2 确定粒度的级别 2.6.3 数据仓库的聚集模型确定 2.6.4 聚集模型的处理 2.6.5 聚集模型的管理 练 习 1.在一般的信息管理中采用哪些概念模型来描述信息处理的对象,这些概念数据模型是否适合数据仓库的开发环境? 2.航空公司希望能够分析在其服务旅客中的常客旅行趋势,这样可以为公司正确定位航空市场中的常客市场。并且希望能够跟踪不同航线上旅客的季节变化情况和增长,并跟踪在不同航班上所消费的食品和饮料情况,这样可以帮助航空公司安排不同航线上的航班和食品供应。现在所面对的任务是为其设计一个数据仓库的概念模型、逻辑模型和物理数据模型。 3.为建立第2题中的数据仓库,需要哪些元数据?这些元数据在不同的阶段应该发挥什么作用? 4.第2题中航空公司希望能够将旅客数据至少保持三年,公司每天有100条航线,共300架次飞行,每架次的旅客平均为100人。每架次的食品种类有50种,前后共采购过1000种。食品受到季节影响较大,每年的食品价格呈现一种周期性变化。食品的详细数据只需一年就可以。请为航空数据仓库设计一个合适的数据粒度模型。 * * 数据库 异质总体 整体间联系 客户与产品 表文件 同质总体 整体 客户 记录 实体 个体 张三 列(字段、数据项) 属性 特性 信用 计算机世界 逻辑世界 概念世界 现实世界 现实世界 概念模型 逻辑模型 物理模型 数据仓库 元数据模型 数据粒度和聚集模型 财务部门 销售收入账 应收账 应付账 成本账 销售部门 销售计划 销售合同 销售统计 人事部门 员工业绩记录 员工技能情况 员工薪酬表 企业数据模型 销售部门 人事部门 财务部门 … …… …… 图2.3 企业数据模型 指标实体名 维度实体名 详细类别实体名 维度实体 详细类别实体(引用实体) 第一范式、第二范式、第三范式数据仓库的反规范化处理 短期的框架 快速变化 记录级的访问 标准查询访问 实时更新 事件驱动 长期的框架 静态 数据通常是汇总的 特殊查询访问 定期更新 数据驱动 普通数据库系统的数据 数据仓库的数据 星型模型是最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析服务对象。 事实表 维度表 维度表 维度表 维度表 维度表 核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度
文档评论(0)