- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[企业管理]第13章数据仓库技术
第13章 数据仓库技术 数据仓库是数据库技术的另一重要发展方向。 人们希望能更多地通过数据库系统获得决策支持信息的推动下发展起来的一项新数据库技术。 本章主要介绍操作性处理与分析型处理的区别,联机事务处理(OLTP)和联机分析处理(OLAP)的不同,数据仓库技术的基本概念、组成结构、技术特征、设计,数据挖掘和决策支持系统(DSS),以及SQL Server的DBMS对数据仓库的支持。 第13章 数据仓库技术 13.1 从数据库到数据仓库 13.2 数据仓库的结构 13.3 数据仓库的设计 13.4 OLAP与数据仓库 13.5 数据挖掘(data mining,DM) 13.6 决策支持系统与数据仓库 13.7 SQL Server 2000的数据仓库 13.8 小结 13.9 习题 13.1 从数据库到数据仓库 13.1.1 操作型处理和分析型处理 13.1.2 从数据库到数据仓库 13.1.3 操作型数据和分析型数据 13.1.1 操作型处理和分析型处理 13.1.2 从数据库到数据仓库 产生的根本原因是对决策信息的迫切需求。 20世纪90年代以来,在操作型数据环境中建立DSS效果不理想。 对传统数据库反思。??? 在规划设计的基础上,对数据库中的数据按照不同的主题归纳、统计、汇总、集成,使其长期保存在计算机中,并随着时间推移不断追加,这样形成的数据集合便是我们所说的数据仓库。 13.1.3 操作型数据和分析型数据 13.2 数据仓库的结构 数据仓库是一个不同于传统数据库的数据集合,它是对传统数据库进行抽取、归纳、统计、汇总集成而成。 13.2.1 数据仓库的概念及特点 13.2.2 数据仓库的组成结构 13.2.3 数据仓库的数据组织 13.2.4 数据仓库需要的数据库技术 13.2.1 数据仓库的概念及特点 数据仓库是一种高级、复杂的数据库技术。完整的数据仓库理论包括三个方面:数据仓库技术、联机分析处理(OLAP)、数据挖掘(DM)。 数据仓库是一个面向主题的、集成的、稳定的、随时间而变的数据集合,用以支持经营管理过程中的决策制订过程。 数据仓库四特征:面向主题、集成、稳定和随时间变化。 13.2.2 数据仓库的组成结构 从构成元素上看,数据仓库由物理元素和功能元素的组成,包括数据源、关系数据库、数据集市、维度、级别、度量值、单元、多维数据集、分区和聚合等。 数据仓库系统总体组成结构一般包含7个部分:数据源部分、数据抽取转换和装载工具、数据建模工具、数据仓储、数据仓库的目标数据、数据仓库管理工具、前端数据访问分析工具。 13.2.2数据仓库的总体组成结构图 13.2.2数据仓库基本功能5部分图 13.2.2数据仓库基本功能5部分1 (1)数据定义:主要完成仓库结构和环境定义,包括:定义数据仓库中数据库模式、数据源和从数据源提取数据时的一组规则或模型。 (2)数据提取:负责从数据源提取数据,并对获得的源数据进行必要的加工处理,使其成为数据仓库可以管理的数据格式和语义规范。 (3)数据管理:由一组系统服务工具组成,负责数据的分配和维护,支持数据应用。数据分配完成获取数据的存储分布以及将其分发到多台数据库服务器。数据维护服务完成数据的转储和恢复、安全性定义和检测等。用户直接输入系统的数据也由该部分完成。 13.2.2数据仓库基本功能5部分2 (4)信息目录:信息目录描述系统数据的定义和组织,通过它用户或开发人员可以了解数据仓库中存放的数据,以及如何访问、使用和管理。按数据仓库数据管理与应用要求,其信息目录可以设计为多个子部分:技术目录、业务目录和信息导航目录。 (5)数据应用:除了一般的直接检索性使用外,还能完成常用的数据表示和分析,如图表表示、统计分析、结构分析、相关分析和时间序列分析等。对于涉及到众多数据的综合性较强的分析,可以借助专业数据分析工具。在客户机/服务器体系结构下,这部分功能可以放在客户端来完成,以便充分利用目前微机上丰富的数据分析软件。 13.2.3 数据仓库的数据组织 数据仓库的数据来源于RDB,需要进行转化。 数据仓库的数据长期保存。 数据组织需要考虑以下方面:粒度、分割以及数据的模型结构。 13.2.3 数据仓库的数据组织 图13_3 一个典型的数据仓库的数据组织结构 13.2.3 数据仓库数据组织:粒度 粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级越小;相反,细化程度越低,粒度级越大。 粒度影响存放在数据仓库中数据量的大小,同时影响数据仓库所能回答的查询类型。 小粒度级或高细节级,可回答任何问题,但数据量大。大粒度级或低细节级,数据量少。在设计数据仓库时,需要在数据量大小与查询的详细程度之间要作出权衡,对粒度级进行权衡,
文档评论(0)