网站大量收购独家精品文档,联系QQ:2885784924

oracle_数据仓库简介.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库和BI jianhui.wang 2011;第一课堂 基本概念;而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后极少或根本不修改,数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时不仅能满足决策分析的需要,而且都要标明该数据的历史时期。 d) 数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其他数据库。传统的数据库系统主要负责日常操作性的事务处理任务,而数据仓库承担支持决策分析服务的数据平台。 ; 面向主题图解 操作型环境 数据仓库 汽车 顾客 人寿 保险单 健康 保险费 意外伤亡 索赔 应用 主题 面向主题是通过一组相关的表来具体实现的。;二、构建数据仓库的关键技术 数据仓库的构建偏向于工程,具有强烈的工程性,其关键技术主要有数据抽取、数据组织、数据表现三个方面。 a)数据抽取 数据的抽取是数据进入数据仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从数据库系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。数据仓库的数据并不要求与数据源保持实时的同步,因此数据抽取可以定时进行,但多个抽取操作执行的时间、相互的顺序、成败对数据仓库中信息的有效性则至关重要。 见下图所示:; ; b)数据组织 数据仓库是存储数据的一种组织形式,它从传统数据库中获得原始数据(数据源),先按辅助决策的主题需求形成当前基本数据层(接口层,比如本公司数据库RP用户),再按综合决策的要求形成综合数据层(中间层,比如MID用户) 。随着时间的推移,由时间控制机制将当前基本数据层转为历史数据。 c)数据形式 数据仓库中存放着不同综合级别的数据,可分为四个级别:早期细节级、当前细节级、轻度综合级和高度综合级。源数据经过综合处理之后,首先进入当前细节级,并根据具体需要进一步的综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级。 ; d)确定数据粒度 数据粒度与数据仓库结构相关,是指数据仓库中一组数据单元所包含数据的详尽程度。粒度越大,数据表示的细节程度则越低,综合程度越高。粒度直接影响到驻留在数据仓库里的数据量以及在同一时间里可以得到响应的查询类型。对于大型的数据仓库,往往需要建立多层粒度,其中一层对应数据仓库的当前细节级数据,一层对应轻度综合级数据,其他层则根据系统的性能要求以及业务的具体要求来设计。 确定适当的粒度水平,首先要对数据的记录数和数据仓库的磁盘空间进行估算,接着考虑粒度的大小。通常利用经验选择粒度水平,先创建部分数据仓库让用户使用,当用户产生新的需求后,再对粒度进行调整,最终建立整个数据仓库的粒度水平和存储方式。 见下图: ; 以中青宝游戏数据库为例: ; e)数据表现 数据表现本质上是指数据仓库的应用。目前,数据仓库已经广泛地应用在银行、金融服务、消费物品和零售批发部门,以及诸如基于需求的产品生产。就功能而言,数据仓库的应用主要体现在信息处理、分析处理和数据挖掘三个方面: 信息处理:支持查询和基本的统计分析,并使用交又表、表、图表或图进行报告。数据仓库信息处理的当前趋势是构造低成本的基于Web的存取工具,然后与Web浏览器集成在一起。 分析处理:支持联机分析处理OLAP。分析处理一般是在汇总的和细节的历史数据上操作,主要优势在于支持多维数据分析。 数据挖掘:支持知识发现,包括寻找隐藏的模式和关联,构造分析模式,进行分类和预测,并用可视化工具提供挖掘结构。总的来说,数据仓库的性能,集中表现在多维分析、数据挖掘方面。; 总之,数

文档评论(0)

ayangjiayu3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档