(数据仓)数据仓库技术概述.pdfVIP

  • 3
  • 0
  • 约1.31万字
  • 约 23页
  • 2020-10-15 发布于四川
  • 举报
(数据仓)数据仓库技术概 述 数据仓库技术概述 数据仓库技术 随着数据库技术的日趋成熟以及应用系统逐渐完善,无论是利用 早期的 RDB、Dbase ,还是后来以其领先的核心技术日渐垄断关系数 据库市场的 Oracle 、Sysbase 、DB2, 企业已经积累了大量的数据,这 些数据信息为企业的发展提供了客观依据。毫无疑问,在竞争激烈的 商业环境下,信息将是取胜的关键因素,决策者必须能快速可靠、随 时自主地访问企业数据,才能有效地做出计划和决策。在这种需求牵 引下,形成了数据仓库( DataWarehouse )的新概念、新技术。 1 数据仓库的概念 数据仓库的提出是以关系数据库、并行处理和分布式技术的飞速 发展为基础,是解决信息技术( IT )在发展中存在的拥有大量数据, 而其中有用信息贫乏的综合解决方案。数据仓库是一种新的数据处理 体系结构,是对企业内部各部门业务数据进行统一和综合的中央数据 仓库。它为企业决策支持系统( DSS )和经理信息系统( EIS)提供所 需的信息。它是一种信息管理技术,为预测利润、风险分析、市场分 析以及加强客户服务与营销活动等管理决策提供支持的新技术。 数据仓库技术对大量分散、独立的数据库经过规划、平衡、协调 和编辑后,向管理决策者提供辅助决策信息,发挥大量数据的作用和 价值。 概括地说,数据仓库是面向主题的( Subject-Oriented )、集成 的(Integrated) 、稳定的 (Nonvolatile) 、不同时间的 (Timer-Variant) 数据集合 ,用于支持经营管理中决策制订过程。 数据仓库中的数据面向主题,与传统数据库面向应用相对应。主 题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观 的分析领域:数据仓库的集成特性是指在数据进入数据仓库之前,必 须经过数据加工和集成,这是建立数据仓库的关键步骤,首先要统一 原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面 向主题的转变;数据仓库的稳定性是指数据仓库反映的是历史数据的 内容,而不是日常事务处理产生的数据,数据经加工和集成进入数据 仓库后是极少或根本不修改的;数据仓库是不同时间的数据集合,它 要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数 据仓库中的数据都要标明该数据的历史时期。 数据仓库最根本的特点是物理地存放数据,而且这些数据并 不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立并 不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础 上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中 承担的是日常操作性的任务。数据仓库是数据库技术的一种新的应 用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其 中的数据。 传统数据库用于事务处理,也称为操作型处理,是指对数据库联 机进行日常操作,即对一个或一组记录的查询和修改,主要面向企业 特定的应用服务。用户关心的是响应时间、数据的安全性和完整性。 数据仓库用于决策支持,也称分析型处理,它是解决决策支持系统的 基础。 数据仓库的数据概念模型是数据的多维视图,它直接影响到前端工 具、数据库的设计和联机分析处理 (OnLineAnalyticalProcessing,OLAP )的查询引擎。在多维数据模 型中,一部分数据是数字测量值,而这些数字测量值是依赖于一组维 的,这些维提供了测量值的上下文关系。因此,多维数据视图就是这 样一些由层次的维构成的多维空间中,存放着数字测量值。多维概念 模型的另一个特点是对一个或多个维所做的集合运算。这些运算可以 包括对于同样维所限定的测量值的比较。一般来说,时间维是一个有 特殊意义的维,对决策中的趋势分析很重要。 针对多维模型产生了 OLAP 分析方法,包括以下三种: (1 ) 旋转:即将表格的横、纵坐标交换( x 、y )→(y 、x ). (2 ) 上钻和下钻 :对所关心的数据根据维的层次提升或降低观察的

文档评论(0)

1亿VIP精品文档

相关文档