数据库基础与应用课件作者王珊李盛恩第11章节.pptVIP

数据库基础与应用课件作者王珊李盛恩第11章节.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11章 数据仓库技术 11.1 概 述 存在两种不同的数据处理工作,操作型处理和分析型处理,也称作OLTP(联机事务处理)和OLAP(联机分析处理)。 操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,如火车售票系统、银行通存通兑系统和税务征收管理系统等。这些系统要求快速响应用户请求,对数据的安全性、完整性以及事务吞吐量要求很高。 分析型处理是指对数据的查询和分析操作。通常是对海量的历史的数据查询和分析,如金融风险预测预警系统和证券股市违规分析系统等。这些系统要访问的数据量非常大,查询和分析的操作十分复杂。 两者之间的差异使得传统的数据库技术不能同时满足这两类数据处理的要求,数据仓库技术应运而生。 11.2 从数据库到数据仓库 数据库系统作为数据管理的最新手段,成功地用于事务处理领域。在这些数据库中保存了大量的日常业务数据。早期的决策支持系统(DSS)试图直接建立在事务处理环境下。 数据库技术一直力图使自己能胜任从事务处理、批处理到分析处理的各种类型的信息处理任务。尽管数据库在事务处理方面的应用获得了巨大成功,但它对分析处理的支持一直不能令人满意,尤其是当以事务处理为主的OLTP应用与以分析处理为主的DSS应用共存于同一个数据库系统中时,这两种类型的处理发生了明显的冲突。人们逐渐认识到事务处理和分析处理具有极不相同的性质,直接使用事务处理环境来支持DSS是不合适的。 具体来说,事务处理环境不适宜DSS应用的原因概括起来主要有以下四个方面: 1.事务处理和分析处理的性能特性不同 2.数据集成问题 DSS需要集成的数据。 数据集成是一项十分繁杂的工作。 数据集成后数据源中的数据仍然在不断变化,这些变化应该及时反映到数据仓库中,使决策者准确探知系统内的数据变化。 3.历史数据问题 4.数据的综合问题 在事务处理系统中积累了大量的细节数据,一般而言,DSS并不对这些细节数据进行分析,原因之一是细节数据数量太大,会严重影响分析的效率;原因之二是太多的细节数据不利于分析人员将注意力集中于有用的信息上。 11.3 数据仓库的基本概念 11.3.1 什么是数据仓库 数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织技术。由于分析处理和事务处理具有极不相同的性质,因而两者对数据也有不同的要求。数据仓库概念的创始人W.H. Inmon在其《Building Data Warehouse》一书中,列出了操作型数据与分析型数据之间的区别,如表11.1所示。 数据仓库和数据库主要的区别是数据仓库中的数据具有以下四个基本特征: (1)数据仓库的数据是面向主题的; (2)数据仓库的数据是集成的; (3)数据仓库的数据是不可更新的; (4)数据仓库的数据是随时间不断变化的。 11.3.2 主题与面向主题 与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的。什么是主题呢?从逻辑意义上讲,主题是企业中某一宏观分析领域所涉及的分析对象。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据进行综合、归类并分析利用。所谓较高层次是相对面向应用的数据组织方式而言的,是按照主题进行数据组织的方式具有更高的数据抽象级别。 为了更好地理解主题与面向主题的概念,说明面向主题的数据组织与传统的面向应用的数据组织方式的不同,我们用一个例子来详细说明。 一家采用“会员制”经营方式的商场,按业务已建立起销售、采购、库存管理以及人事管理等子系统。按照其业务处理要求,建立了各子系统的数据库模式: 采购子系统: 订单(订单号,供应商号,总金额,日期) 订单细则(订单号,商品号,类别,单价,数量) 供应商(供应商号,供应商名,地址,电话) 销售子系统: 顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话) 销售(员工号,顾客号,商品号,数量,单价,日期) 库存管理子系统: 领料单(领料单号,领料人,商品号,数量,日期) 进料单(进料单号,订单号,进料人,收料人,日期) 库存(商品号,库房号,库存量,日期) 库房(库房号,仓库管理员,地点,库存商品描述) 人事管理子系统: 员工(员工号,姓名,性别,年龄,文化程度,部门号) 部门(部门号,部门名称,部门主管,电话) 按照面向主题的方式,应该分两个步骤来组织数据:抽取主题以及确定每个主题所应包含的数据内容。 抽取主题 按照分析的要求确定主题。这与按照数据处理或应用的要求来组织数据相比,主要不同在于同一部门关心的

您可能关注的文档

文档评论(0)

118压缩包课件库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档