UNIT2数据仓库的环境.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
UNIT2数据仓库的环境

UNIT two 数据仓库环境 本 讲 主 要 目 标 学完本讲后,你应该能够了解: 数据仓库的定义; 数据仓库的特点是:面向主题的、集成的、非易失的和随时间变化的; 数据仓库的多粒度数据结构可满足不同层次的需求,且粒度与分割技术是提高数据仓库性能的两个关键技术; 建立数据仓库的典型过程是由核心逐步扩展的过程,随着扩展,数据仓库面临着性能下降的问题; 数据仓库中的数据不是多数据库数据的简单堆积,而是通过多种主要方式来组织:简单堆积文件、轮转综合文件、简单直接文件和连续文件; 数据仓库中的数据是有生命周期的,需要定期做数据清理。 一.数据仓库的定义 二.数据仓库的特点 三.数据仓库的数据结构 四.建立数据仓库的典型过程 五.数据仓库的数据组织形式 六. 清理数据仓库 数据仓库 的定义 数据仓库的定义 世界公认的数据仓库概念创始人W.H.Inmon在《数据仓库》(Building the Data Warehouse)一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、非易失的(稳定性)、随时间变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。 数据仓库 的特点 数据仓库的特点 数据仓库的特点 数据仓库的特点 面向主题的 什么是主题? 主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。 数据仓库的特点 面向主题的 数据仓库的特点 面向主题的 传统的操作型系统是围绕公司的应用进行组织的.对一个保险公司来说,应用问题可能是汽车保险、人寿保险与意外伤亡保险。公司的主要主题范围可能是顾客、保险单、保险费与索赔。 数据仓库的特点 面向主题的 数据仓库的特点 面向主题的 什么是面向主题的数据组织方式? 就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。 所谓较高层次是相对面向应用的数据组织方式而言的,是指按照主题进行数据组织的方式具有更高的数据抽象级别。 数据仓库的特点 面向主题的 – 主题以一组相关的表来具体实现 数据仓库的特点 面向主题的 – 主题的表通过一个公共键值联系起来 数据仓库的特点 面向主题的 – 一个主题的数据可存储在不同介质上 数据仓库的特点 面向主题的 – 相同的数据既有综合级,又有细节级,每个键码都有一个时间元素 数据仓库的特点 集成的 指数据由面向应用的操作型环境向数据仓库传送时所进行的集成 数据仓库的特点 集成的 数据仓库的特点 集成的 应用问题的设计人员历经多年制定出来的不同的设计决策有很多种不同的表示方法,没有什么应用在编码、命名习惯、属性度量等方面是一致的,各个应用问题设计员自由地做出他或她自己的设计决策。 数据仓库的特点 集成的 数据仓库的特点 非易失的 操作型数据 一次访问和处理一个记录 可以对操作型环境中的数据进行更新 数据仓库 一起载入与访问大量数据 不进行一般意义上的数据更新 数据仓库的特点 非易失的 数据仓库的特点 非易失的 数据仓库的特点 随时间变化的 数据仓库中的数据时间期限要远远长于操作型系统中的时间期限 操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是有效的,并且是可更新的;数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照 操作型数据的键结构可能包含也可能不包含时间元素,而数据仓库的键结构总是包含某时间元素 数据仓库的特点 随时间变化的 数据仓库的特点 随时间变化的 数据仓库 的数据结构 数据仓库的数据结构 数据仓库的数据结构 在数据仓库中,数据存在着不同的细节级: 早期细节级(通常是备用的、批量的存储) 当前细节级 轻度综合数据级(数据集市) 高度数据综合级 数据仓库的数据结构 数据仓库的数据结构 数据仓库的数据结构 数据仓库的数据结构 数据仓库的数据结构 粒度问题 粒度 – 是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级别越小 粒度问题是设计数据仓库的一个最重要的方面 数据仓库的数据结构 粒度问题 粒度的设计问题:粒度的大小影响存放在数据仓库中的数据量的大小,同时,影响数据仓库所能回答的查询类型 数据仓库的数据结构 粒度问题 – 粒度大小影响数据量 数据仓库的数据结构 粒度问题 – 粒度大小影响回答查询的能力 数据仓库的数据结构 粒度问题 – 粒度的权衡很重要,但很难 数据仓库的数据结构 样本数据库 样本数据库是真实档案数据或轻度综合数据的子集 数据仓库的数据结构 样本数据库 样本数据库是另一种在数据仓库中改变粒度的方法 样本数据库不是通用的

您可能关注的文档

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档