- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 23
第三章 数据仓库设计
DW设计是一个操作型系统设计方法演变而来的范例。DW设计者不仅要设计一个数据库(DW用DB实现)和一个用户接口(数据展现部分)。而且还必须设计数据与OLTP系统的接口,数据装载策略,数据存取工具,用户培训方案和不间断的维护方案。即必须考虑许多在操作型系统设计中不必考虑的问题。本章的意图就是帮助你完善的理解如何建立和实现DW和在一个完整的DW设计必须考虑的问题。
我们要设计DW,首先要了解他的开发生命周期。
1 2 3 4 5 6 7
传统的 收集 分析 设计 编程 调试 集成 实现
SDLC 需求
需求驱动
SDLCDW的 实现DW 集成数据 检验偏差 针对数据编程 设计DSS系统 分析结果 理解需求
SDLC
数据驱动
3.1 数据仓库开发的方法
建立一个DW一般需做以下五个方面的工作:
1、任务和环境的评估。
2、需求的收集和分析。
3、构造DW。
4、DW技术的培训。
5、回顾、总结和再发展。
任务和环境的评估
1、目标:因为数据仓库是建立在原有的运行系统之上的,因此要结合单位的现状来明确数据仓库的目标任务。了解数据源所在系统和其中数据的状况、数据类型、工作平台、数据量、数据质量、DW的环境、网络技术状况。
2、目的: = 1 \* GB2 ⑴ 看DW的任务是否可行。
= 2 \* GB2 ⑵ 所建立的DW是否是用户所期望的。
= 3 \* GB2 ⑶ 有没有不逾越的障碍。
= 4 \* GB2 ⑷ 确定DW系统成功与否的基本原则。
3、组织:高层负责人参加并组织项目组。
人员:项目总负责人
与DW相关的业务部门负责人
计算机软/硬件负责人
DBA
网络人员
4、项目组的任务:初步确定主题
主题的层次结构
需求的收集和分析。
1、任务: = 1 \* GB2 ⑴ 了解决策者现在的工作目标。
= 2 \* GB2 ⑵ 现在获得决策支持信息的方法、渠道。
= 3 \* GB2 ⑶ 和竞争对手的差距。
= 4 \* GB2 ⑷ 决策者希望DW提供什么。
= 5 \* GB2 ⑸ 制定系统的逻辑模型。
= 6 \* GB2 ⑹ 分析数据源的物理存储状况、运行平台、数据质量、硬件、软件和网络的限制条件。
2、分析文档。
= 1 \* GB2 ⑴项目概述。
= 2 \* GB2 ⑵差距分析。
= 3 \* GB2 ⑶系统基本架构图示。
= 4 \* GB2 ⑷逻辑模型。
= 5 \* GB2 ⑸物理模型。
= 6 \* GB2 ⑹DW的初始装载和更新策略。
= 7 \* GB2 ⑺ DW的运行计划。
= 8 \* GB2 ⑻决策信息展现的希望和需求。
= 9 \* GB2 ⑼ DW建成的时限。
构造DW
构造数据仓库包括数据仓库的管理、数据仓库的组织和决策支持信息的展现三部分。
设计和编写数据抽取程序/工具。
设计和编写数据转换程序/工具。
1、DW的管理 设计和编写数据更新程序/工具。
设计和编写运行的接口程序。
建立这一阶段的所有管理的数据(元数据)
程序统一标准命名、建档。
初始装载
建立索引
2、DW的组织 建立数据视图
DW及工作平台的安全检查
装入数据和应用功能
建立此阶段的元数据。
3、决策支持信息的展现
利用多维数据展现、数据挖掘等一些工具可预先制作好许多常规的信息市场项目供支持决策使用,也可以直接操作主题数据以得出新的决策支持信息。
数据仓库技术的培训。
培训内容:1、DW中的数据内容(包括逻辑模型、物理模型)、数据质量。
2、元数据的内容、位置,如何使用。
3、用户界面和功能介绍。
4、数据更新计划。
5、DW的安全规则。
6、从OLTP到DW的数据流。
7、全部的数据转换工作。
8、数据装载和更新的策略。
文档评论(0)