网站大量收购独家精品文档,联系QQ:2885784924

第3章数据仓库开发应用过程课程.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章数据仓库开发应用过程 数据仓库的开发应用像生物一样具有其特有的、完整的生命周期,数据仓库的开发应用周期可以分成:数据仓库规划分析阶段、数据仓库设计实施阶段以及数据仓库的使用维护三个阶段。 这三个阶段是一个不断循环、完善、提高的过程。在一般情况下数据仓库系统不可能在一个循环过程中完成,而是经过多次循环开发,每次循环都会为系统增加新的功能,使数据仓库的应用得到新的提高。 本章学习目标: (1) 了解数据仓库开发应用的特点 。 (2) 掌握数据仓库的规划 、数据仓库的概念模型设计 、数据仓库的逻辑模型设计 、数据仓库的物理模型设计 和数据仓库的实施 。 (3) 了解数据仓库的应用、支持和增强。 数据仓库开发应用过程 3.1数据仓库开发应用过程 3.2数据仓库的规划 3.3数据仓库的概念模型设计 3.4数据仓库的逻辑模型设计 3.5数据仓库的物理模型设计 3.6数据仓库的实施 3.7数据仓库的应用、支持和增强 练 习 3.1数据仓库开发应用的特点 3.1.1 数据仓库开发应用的阶段性 数据仓库的开发应用过程划分为: 创始阶段 成长阶段 控制阶段 成熟阶段 3.1.2 数据仓库的螺旋式开发方法 3.2 数据仓库的规划 3.2.1 选择数据仓库实现策略 3.2.2 确定数据仓库的开发目标和实现范围 3.2.3 数据仓库的结构 3.2.4 数据仓库使用方案和项目规划预算 3.3 数据仓库的概念模型设计 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.3 概念模型的分析 3.3.4 概念模型的设计 3.3.5 概念模型文档与评审 3.4 数据仓库的逻辑模型设计 3.4.1 分析主题域 3.4.2 粒度层次和聚集的确定 3.4.5 数据仓库的实体定义 3.4.5 数据仓库的实体定义 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.7 数据仓库的元数据模型建立与应用 3.4.8 逻辑模型的评审 3.5 数据仓库的物理模型设计 3.5.1 数据仓库设计的规范 3.5.2 确定数据结构的类型 3.5.3 数据仓库索引的创建 3.5.4 确定数据存放位置 3.5.5 确定存储分配 3.6 数据仓库的实施 3.6.1 数据仓库与业务处理系统接口的设计 3.6.2 数据仓库的创建 3.6.3 数据仓库的数据加载、复制与发行 3.6.4 数据仓库的中间件设计 3.6.5 数据仓库的测试 3.7 数据仓库的应用、支持和增强 3.7.2 数据仓库的使用方式 3.7.4 数据仓库的增强 练 习 1.为什么说数据仓库的开发是一个不断循环、逐步提升的开发过程? 2.数据仓库的生命周期应该包含哪几个阶段?需要完成哪些工作? 3.在数据仓库的需求分析中需要对哪些人员进行需求调查,应该调查哪些内容? 4.数据仓库的设计包含那些内容? 5.怎样通过数据仓库的应用来增强数据仓库的功能与作用? 练 习 6.请为购买商品趋势分析设计一个数据仓库的星型模型,并给出维表的层次结构。 7.请为航空公司的航班分析数据仓库确定其主题的详细描述。 8.为航空公司的航班分析数据仓库设计一种数据抽取和转换方案,并提出选择此方案的理由。 9.在数据仓库的开发过程中需要对哪些模型进行评审,不同模型的评审内容有哪些? 逻辑模型的文档内容:主题域分析报告,数据粒度划分模型,数据分割策略,指标实体、维实体与详细类别实体的关系模式和数据抽取模型。 对逻辑模型的评审主要集中在主题域是否可以正确地反映用户的决策分析需求。 从用户对概括数据使用的要求,评审数据粒度的划分和数据分割策略是否可以满足用户决策分析的需要。 为提高数据仓库的运行效率是否需要对关系模式进行反规范化处理。 数据的抽取模型是否正确地建立了数据源与数据仓库的对应关系。 数据的约束条件和业务规则是否在这些模型中得到了正确的反映。 表的数据结构类型、索引策略、数据存放位置以及数据存储分配等等。 物理模型设计因素:I/O存取时间、空间利用率和维护的代价。 工作: 全面了解所选用的数据库管理系统,特别是存储结构和存取方法。 了解数据环境、数据的使用频率、使用方式、数据规模以及响应时间要求等。 了解外部存储设备的特征。 保证数据仓库的设计、实施和管理保持稳定,不产生混乱,需要

文档评论(0)

hushuidhd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档