oracle_数据仓库简介教材课程.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
oracle_数据仓库简介教材课程.ppt

数据仓库和BI简介 jianhui.wang 2011 培训目的:1. 了解数据仓库及BI的基本概念 2. 设计数据仓库 3. 本公司目前数据库仓库结构 4. BI建模分析及提供数据给决策层 第一课堂 基本概念 一、数据仓库 数据仓库是面向主题的、集成的、稳定的(不可更新的)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。 a) 面向主题与传统数据库的面向应用相对应,主题是一个在较高层次上将数据归类的标准,每个主题对应一个宏观的分析领域; b) 集成特性是指数据在进人数据仓库前,必须经过加工和集成,以统一原始数据中的矛盾之处,还要将原始数据结构从面向应用转变为面向主题。 c) 稳定性是指数据仓库反映的是已成为历史的数据, 而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后极少或根本不修改,数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时不仅能满足决策分析的需要,而且都要标明该数据的历史时期。 d) 数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其他数据库。传统的数据库系统主要负责日常操作性的事务处理任务,而数据仓库承担支持决策分析服务的数据平台。 面向主题图解 操作型环境 数据仓库 汽车 顾客 人寿 保险单 健康 保险费 意外伤亡 索赔 应用 主题 面向主题是通过一组相关的表来具体实现的。 二、构建数据仓库的关键技术 数据仓库的构建偏向于工程,具有强烈的工程性,其关键技术主要有数据抽取、数据组织、数据表现三个方面。 a)数据抽取 数据的抽取是数据进入数据仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从数据库系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。数据仓库的数据并不要求与数据源保持实时的同步,因此数据抽取可以定时进行,但多个抽取操作执行的时间、相互的顺序、成败对数据仓库中信息的有效性则至关重要。 见下图所示: b)数据组织 数据仓库是存储数据的一种组织形式,它从传统数据库中获得原始数据(数据源),先按辅助决策的主题需求形成当前基本数据层(接口层,比如本公司数据库RP用户),再按综合决策的要求形成综合数据层(中间层,比如MID用户) 。随着时间的推移,由时间控制机制将当前基本数据层转为历史数据。 c)数据形式 数据仓库中存放着不同综合级别的数据,可分为四个级别:早期细节级、当前细节级、轻度综合级和高度综合级。源数据经过综合处理之后,首先进入当前细节级,并根据具体需要进一步的综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级。 e)数据表现 数据表现本质上是指数据仓库的应用。目前,数据仓库已经广泛地应用在银行、金融服务、消费物品和零售批发部门,以及诸如基于需求的产品生产。就功能而言,数据仓库的应用主要体现在信息处理、分析处理和数据挖掘三个方面: 信息处理:支持查询和基本的统计分析,并使用交又表、表、图表或图进行报告。数据仓库信息处理的当前趋势是构造低成本的基于Web的存取工具,然后与Web浏览器集成在一起。 分析处理:支持联机分析处理OLAP。分析处理一般是在汇总的和细节的历史数据上操作,主要优势在于支持多维数据分析。 数据挖掘:支持知识发现,包括寻找隐藏的模式和关联,构造分析模式,进行分类和预测,并用可视化工具提供挖掘结构。总的来说,数据仓库的性能,集中表现在多维分析、数据挖掘方面。

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档