数据仓库模型设计及数据仓库建立.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库模型设计及数据仓库建立

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 4. 分割表的存放 在逻辑设计中按时间、地区、业务类型等多种标准把一个大表分割成许多较小的、可以独立管理的小表,称为分割表。这些分割表可以采用分布式的存储方式。如图3.22按病症类型将数据表分割成两个表,这两个表分别存放在两个磁盘阵列组中。 3.3.2 数据存储策略(5) 3.4 数据仓库的建立过程 3.4.0 概述 3.4.1 需求分析 3.4.2 数据路线 3.4.3 技术路线 3.4.4 应用路线 3.4.5 数据仓库部署 3.4.6 运行维护 3.4.0 概述(1) 数据仓库是由源数据、ETL、元数据、OLAP、数据挖掘、管理和控制等多个不同的组成部分构成,各个部分能提供不同的功能和服务。 数据仓库的建立就是要将数据仓库的所有部分结合在一起,形成体系结构,使数据从源系统流向最终用户。 数据仓库的建立过程实际上是从传统的以数据库为中心的操作型系统结构转移到以数据仓库为中心的体系结构的过程。 数据仓库的建立从数据、技术和应用三方面展开,各方面工作完成之后,进行数据仓库部署,然后数据仓库投入运行使用,同时管理人员对数据仓库进行维护,完成数据仓库的一个生命周期。如图3.23所示。 3.4.0 概述(2) 3.4.0 概述(2) 3.4.1 需求分析(1) 需求分析最终是要形成一个比较具体的需求定义文档。需求定义文档的提纲如下: 绪论。 总体需求描述。 具体需求。 指标及维度。 其他需求。 用户期望。 用户参与。 综合实施计划。 需求定义文档的建立非常重要。 首先,需求定义文档是下一个阶段的基础; 其次,如果某个开发成员因为某种原因不得不离开,需求定义文档使得开发工作不会因为缺少了这个成员的知识而遭受损失; 正式的文档还可以帮助后来的阅读者验证已完成的工作。 3.4.1 需求分析(2) 3.4.2 数据路线 数据路线包括模型设计和数据装载接口设计,用以满足对数据的有效组织和管理。 模型设计包括概念模型设计、逻辑模型设计、物理模型设计几个步骤,数据装载接口(ETL)设计需要编制数据载入程序,该程序包括了数据装载功能和数据综合功能。 数据装载功能负责数据抽取、转换、清洗、集成,数据综合功能负责将细节数据转化为不同综合层次的数据。 3.4.3 技术路线(1) 技术路线主要确定数据仓库的基础构造。数据仓库的基础构造可以分成两大类:操作型基础构造和物理基础构造。 1. 操作型基础构造 操作型基础构造包括人员、流程、培训和管理软件。这些人员和流程不是开发数据仓库所需要的,而是维持数据仓库运行所需要的,它们支持数据仓库的管理工作并保持它的工作效率。 2. 物理基础构造 物理基础构造的主要组成部分为计算机平台和一系列的工具。 计算机平台 一个计算机平台就是硬件部分、操作系统、数据库管理系统、网络和网络软件的集合。 工具 软件工具是数据仓库环境基础架构的一个很重要的组成部分,在数据仓库开发周期中的不同阶段都会使用软件工具。 3.4.3 技术路线(2) 3.4.4 应用路线(1) 应用设计包括OLAP模型设计、数据挖掘模型设计和信息展示设计等。 1. OLAP模型设计 OLAP模型设计的思想是先分析问题中可能涉及的所有维度,针对每一个主题确定其需要的维度和度量变量,然后为每一个主题定义OLAP模型。 2. 数据挖掘模型设计 在数据挖掘前需要根据不同的算法要求转化数据的格式,进行变量选择。为了优化模型参数,验证模型,需要将数据划分成训练集合、验证集合,使用训练集合优化模型中的参数,使用验证集合对模型进行评价,如图3.24所示。 3.4.4 应用路线(2) 3.4.4 应用路线(2) 3. 信息展示设计 数据仓库建立的目的是为用户提供战略性的决策信息。这些信

文档评论(0)

wangyueyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档