[第8章+数据仓库.pptVIP

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[第8章数据仓库

第八章 数据仓库 8.1 数据仓库概述 8.1.1 数据仓库的产生 1988年IBM爱尔兰公司第一次提出了“信息仓库”的概念。 90年代初数据仓库的基本原理、框架架构,分析系统的主要原则都已经确定,主要的技术已具备,一些公司开始建立数据仓库。 92年美国著名的信息工程学家William H.Inmon 在《Building the Data Warehouse》(《建立数据仓库》)一书中首先系统的阐述了数据仓库的思想、理论。被人们尊称为“数据仓库之父”。 8.1.2 数据仓库的应用价值 传统数据库的处理方式和决策分析中的数据需求不相称,主要表现在: 1.决策处理的系统响应问题 2.决策数据需求的问题 3.决策数据操作的问题 8.1.3 数据仓库的发展过程 1995年开始盛行,作为数据库的高端扩展技术一直是一大热点。 IBM所推崇的商业智能(BI)核心就是数据仓库; 微软的SQL Server 7.0 已经绑定了OLAP服务器,将数据仓库功能集成到数据库中,并建立了数据仓库联盟; Oracle公司的Oracle Express系列OLAP产品用来提供决策支持。 8.2 数据仓库的基本概念 W.H.Inmon的定义:数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。 公认的数据仓库概念基本上采用了W.H.Inmon的定义:数据仓库是面向主题的、集成的、不可更新的(稳定性)随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。 8.2 数据仓库的基本概念 表8-1 操作型数据与分析型数据的区别 8.2 数据仓库的基本概念 数据仓库数据的4个基本特征: 数据仓库的数据是面向主题的; 数据仓库的数据是集成的; 数据仓库的数据是不可更新的; 数据仓库的数据是随时间不断变化的。 8.2 数据仓库的基本概念 1.数据仓库的数据是面向主题的 (1) 主题:是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。 8.2 数据仓库的基本概念 从信息管理的角度——在一个较高的管理层次上对信息系统中的数据按照某一具体的管理对象进行综合、归类所形成的分析对象。 从数据组织的角度——一些数据集合,对分析对象进行了比较完整的、一致的数据描述,这种描述不仅涉及数据自身,还涉及数据之间的关系。 例如,在企业销售管理中,可以抽取出“产品”、“客户”等主题。 8.2 数据仓库的基本概念 (2) 主题划分的原则:必须保证每个主题的独立性。保证对主题进行分析时所需的数据都可以在此主题内找到,保证主题的完备性。 (3) 主题划分的实例 “会员制”经营方式的商场,按业务已建立起销售、采购、库存管理以及人事管理子系统。 1)面向应用的数据组织 如下表7-2所示 8.2 数据仓库的基本概念 8.2 数据仓库的基本概念 2)面向主题的数据组织 如下表8-3所示 8.2 数据仓库的基本概念 8.2 数据仓库的基本概念 2.数据仓库的数据是集成的 统一源数据 命名规则;编码;数据特征;度量单位 (2) 综合和计算 3.数据仓库的数据是不可更新的 具有非易失性或非易变性。可以支持不同的用户在不同的时间查询相同的问题时获得相同的结果。 8.2 数据仓库的基本概念 4.数据仓库的数据是随时间不断变化的 (1) 数据仓库的数据随时间变化 (2) 数据仓库的数据追加 1)时标方法 2)DELTA文件 3)前后映象文件的方法 4)日志文件 8.3 数据仓库的结构 8.3.1 元数据 “关于数据的数据”,如传统数据库中的数据字典就是一种元数据。 1.元数据在数据仓库中的作用 (1)为决策支持系统分析员和高层决策人员服务提供便利 (2)解决面向应用的操作型环境和数据仓库的复杂关系 8.3.1 元数据 2.元数据的使用 3.元数据的分类 (1)按元数据的类型:关于基本数据、用于数据处理和关于企业组织结构的元数据。 (2)按抽象级别:概念级、逻辑级和物理级的元数据。 (3)按元数据承担的任务:静态和动态 (4)从用户的角度:技术元数据和业务元数据。 8.3.1 元数据 4.元数据的内容 (1)数据源的元数据 (2)数据模型的元数据 (3)数据准备区元数据 (4)数据库管理系统元数据 (5)前台元数据 8.3.2 粒度的概念 粒度是指数据仓库的数据单位中保存数据细化或综合程度的级别。分为两种形式: 1.按时间段综合数据的粒度 2.样本数据库 (根据采样率的

文档评论(0)

1789811832 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档