- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10.4数据仓库.ppt
10.4 数据仓库 ; 数据仓库技术的提出是在20世纪90年代初,近几年得到了迅速发展。 目前,许多大型企业都建立或计划建立自己的数据仓库,以进行市场分析和决策支持。 商用数据库管理系统也纷纷推出自己的数据仓库软件。 企业已从数据仓库应用系统中取得了经济效益。 数据仓库系统主要涉及三个方面的技术内容: 数据仓库技术、 联机分析处理(OLAP)技术和数据挖掘(Data Mining,简记为DM)技术。
; 10.4.1 数据仓库的定义与特征
目前,数据库应用主要有两类: 操作型处理和分析型处理。
操作型处理也称为联机事务处理(OLTP)。 OLTP注重数据库的完整性、 安全性以及高可用性。 它是对数据库联机的日常处理,当用户与RDBMS交互时,通过事务对数据库中的数据进行查询或修改。 对于每个事务,OLTP处理的数据是以结构化的、 可预知的方式存储在数据库表中的记录。 OLTP系统提供了最新的数据,这些数据经常被更新、 插入和删除,系统在商业交易实际发生时对它们进行存储。 ; 一个OLTP系统有许多并发用户,这些活动的用户执行读、 插入和修改数据的短小查询。 与OLTP不同,分析型处理主要用于管理人员的决策分析,通过对大量数据(特别是历史数据)的综合、 统计和分析得出有利于企业的决策信息。 这种分析查询,一般需要访问大量的数据和花费相对多的时间才能完成。 而数据仓库和联机分析处理(OLAP)等技术能够从多个数据源收集数据,提供用户进行决策分析。
; W.H.Inmon在《Building Data Warehousing》一书中首先提出了数据仓库这个术语,以下是他的定义: 定义: 数据仓库是面向主题的、 集成的、 时间可变的、 非易失的数据集合,用以支持企业或组织的决策分析处理。 面向主题意味着在较高层次上,对所分析对象提供一个完整、 一致的描述,统一表示分析对象所涉及的数据及数据间的联系。 ; 而传统的事务处理是面向应用的,是根据企业各个部门的业务活动组织数据的。 例如,一个面向操作型处理的企业数据库中有库存量、 订单项、 应付款、 产量等数据。 当这些操作型数据被装入数据仓库时,数据转换为主题,如: 产品、 客户及金融信息等。 有关产品的信息在数据仓库中只出现一次,无论它在操作型数据库的不同表或域中会出现多少次。
; 集成意味着数据在加入数据仓库前必须要经过加工和集成。 数据仓库中每个主题的源数据是面向应用的,并且可能分散在不同的结点中。 在集成数据时,要消除数据中的冲突,进行数据综合和计算。 数据仓库中的数据综合工作可以在抽取数据时生成,也可以在加入数据仓库以后进行综合时生成。 时间可变意味着数据是随时间变化的。 数据仓库系统必须周期性地捕捉OLTP数据库中的新数据,统一集成后增加到数据仓库中去; 另一方面,数据仓库中的数据也有存储时间,过期数据也要被删除,以适应决策分析的要求。 ; 非易失意味着数据是只读的。 数据周期性地装入数据仓库。 数据仓库主要是供决策分析之用,所涉及的数据操作主要是查询。 一般情况下,不要修改数据仓库中的数据。 因为修改会使历史信息失效并且违背数据仓库的主要用途——保存用于分析的商务历史记录。 唯一需要做的修改,就是更新那些一开始装入数据仓库时就不正确的数据。
; 10.4.2 数据仓库系统
数据仓库系统由数据仓库、 数据仓库管理系统和分析工具三部分组成,其结构如图 10 ― 5 所示。
数据仓库的数据来源于多个数据源。 数据源可以是正在运行的数据库中的信息,也可以是跨平台的各种外部系统数据,还可以是各种应用程序软件产生的数据文件。 它的内容包括:
企业内部数据、 市场调查报告以及各种文档等外部数据。
; 图 10 ― 5; 数据仓库管理包括: 对数据仓库进行数据建模,确定从源数据到数据仓库的数据抽取、 转换和装载等,最后确定数据仓库的存储方法。 数据仓库管理系统包括对元数据的管理。
元数据是数据仓库的核心,它用于存储数据模型、 定义数据结构、 定义转换规则、 确定控制信息等。 数据仓库管理还包括对数据的安全、 归档、 维护、 备份、 恢复等工作。 这些工作需要DBMS的支持。 同时它还负责监视信息数据源的变化,对新的或变化的信息进行过滤、 总结或同其他数据源信息进行合并,再装入数据仓库。 ; 数据仓库中的数据组织一般分为四级: 早期细节级(历史数据)
您可能关注的文档
- (单位卡)民爆系统客户服务网站操作说明.doc
- (液晶)操作说明.doc-蠕动泵.doc
- (行销通路设计).ppt
- )系列防爆照明(动力)配电箱.doc
- 01-我国社会福利政策之展望.-中华民国储蓄互助协会.ppt
- 010编码-通州统计信息网.ppt
- 02-实验指导书.doc-能源工程学院-陇东学院.doc
- 02-模型理论.ppt
- 02316《计算机应用技术》自考串讲笔记-江苏自考网.doc
- 02国家数据库上报1.2.ppt.ppt
- 湘教版高中美术选修:美术鉴赏 第一单元 第二课 图像与眼睛(2)(课件)(32张PPT)(内嵌视频).pptx
- 湘美版高中美术绘画 第四课 油画 课件(共98张PPT)(内嵌视频).pptx
- 第10课 人类生活的真实再现——外国古代绘画撷英 课件-高中美术人美版必修美术鉴赏(35张PPT)(内嵌视频).pptx
- 人教版高中美术选修:美术鉴赏 第八课 与时俱进——木刻、漫画、现代雕塑(2) 课件(19张PPT)(内嵌视频).pptx
- 5.2 质朴与率真——浓郁乡情的视觉呈现 课件 高中美术人美版(2019)美术鉴赏(17张PPT)(内嵌视频).pptx
- 人教版美术四年级下册第9课 对称的美 课件(共24张PPT)(内嵌视频).pptx
- 鲁美版 高中美术 第9课 20世纪西方美术的多样表达 课件(共26张PPT)(内嵌视频).ppt
- 人美版高中必修美术《美术鉴赏》第五课:美术作品可以什么都不像吗——走进抽象艺术(59张PPT)(内嵌视频).ppt
- 人教版高中美术选修:美术鉴赏 第四课 天上人间——壁画(3) 课件(24张PPT)(内嵌视频).pptx
- 人教版美术二年级下册 14.友谊卡 课件(共31张PPT)(内嵌视频).pptx
文档评论(0)