数据挖掘第3章.pptVIP

  • 2
  • 0
  • 约1.44万字
  • 约 59页
  • 2018-05-04 发布于四川
  • 举报
第3章数据仓库开发应用过程 数据仓库的开发应用像生物一样具有其特有的、完整的生命周期,数据仓库的开发应用周期可以分成:数据仓库规划分析阶段、数据仓库设计实施阶段以及数据仓库的使用维护三个阶段。 这三个阶段是一个不断循环、完善、提高的过程。在一般情况下数据仓库系统不可能在一个循环过程中完成,而是经过多次循环开发,每次循环都会为系统增加新的功能,使数据仓库的应用得到新的提高。 3.1数据仓库开发应用的特点 3.1.1 数据仓库开发应用的阶段性 数据仓库的开发应用过程划分为: 1、创始阶段:往往是为了满足一种明确的商业需求,倾向于建立一个小型数据仓库来提供管理报表和决策查询。这些数据仓库只能称之为数据集市,这种数据仓库的开发方法会限制企业各个部门今后的信息分享。 2、成长阶段:在这个阶段,为更多的应用开始建立更多的数据仓库。随着多个部门分散数据仓库的建立开始引发大量的问题。 3、控制阶段:在这个阶段需要用控制和整合的方法将各个主题数据仓库整合,从而将多个数据仓库结合起来形成一个决策支持环境。 4、成熟阶段 :成熟的数据仓库具有以下特征:企业聚焦于集成的信息、大量的来源和不断发展的主题领域、有多种用途的单一业务模型、数据的快速采集与加入、广泛的交易采集和使用、以客户为中心、惟一的真实版本、广泛的访问和管理安全、跨部门的应用、从属的数据集市或从属的数据仓库、使用数据仓库支持管理决策活动。 3.1.2 数据仓库的螺旋式开发方法 3.2 数据仓库的规划 3.2.1 选择数据仓库实现策略 3.2.2 确定数据仓库的开发目标和实现范围 3.2.3 数据仓库的结构 3.2.4 数据仓库使用方案和项目规划预算 3.3 数据仓库的概念模型设计 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.3 概念模型的分析 3.3.3 概念模型的分析 3.3.4 概念模型的设计 3.3.5 概念模型文档与评审 3.4 数据仓库的逻辑模型设计 3.4.1 分析主题域 3.4.2 粒度层次和聚集的确定 3.4.3 确定数据分割策略 3.4.4 关系模型定义 3.4.5 数据仓库的实体定义 3.4.5 数据仓库的实体定义 3.4.5 数据仓库的实体定义 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.7 数据仓库的元数据模型建立与应用 3.4.8 逻辑模型的评审 3.5 数据仓库的物理模型设计 3.5.1 数据仓库设计的规范 3.5.2 确定数据结构的类型 3.5.3 数据仓库索引的创建 3.5.4 确定数据存放位置 3.5.5 确定存储分配 3.5.6 数据仓库物理模型的评审 3.6 数据仓库的实施 3.6.1 数据仓库与业务处理系统接口的设计 3.6.2 数据仓库的创建 3.6.3 数据仓库的数据加载、复制与发行 3.6.4 数据仓库的中间件设计 3.6.5 数据仓库的测试 3.7 数据仓库的应用、支持和增强 3.7.1 数据仓库的用户培训及支持 3.7.2 数据仓库的使用方式 3.7.3 数据仓库使用中的数据刷新 3.7.4 数据仓库的增强 练 习 1.为什么说数据仓库的开发是一个不断循环、逐步提升的开发过程? 2.数据仓库的生命周期应该包含哪几个阶段?需要完成哪些工作? 3.在数据仓库的需求分析中需要对哪些人员进行需求调查,应该调查哪些内容? 4.数据仓库的设计包含那些内容? 5.怎样通过数据仓库的应用来增强数据仓库的功能与作用? 练 习 6.请为购买商品趋势分析设计一个数据仓库的星型模型,并给出维表的层次结构。 7.请为航空公司的航班分析数据仓库确定其主题的详细描述。 8.为航空公司的航班分析数据仓库设计一种数据抽取和转换方案,并提出选择此方案的理由。 9.在数据仓库的开发过程中需要对哪些模型进行评审,不同模型的评审内容有哪些? (2)数据抽取、转换与加载对策 ①全库比较。即将数据源数据的当前瞬间状态与上一次数据抽取时的瞬间状态进行比较,将两者的差异记录在增量文件中,增量文件作为数据加载的来源。 ②利用程序日志。该方法主要是在数据源的业务处理系统中利用程序记录将发生变化的数据记录下来,形成增量文件,根据数据仓库的需要传送到数据仓库中。 ③利用数据库日志。

文档评论(0)

1亿VIP精品文档

相关文档