- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第15章 数据仓库技术 本章概述 前一章研究了用于广度计算的分布式数据库技术,现在开始研究实现深度计算的数据仓库技术。在过去的几十年中,数据库技术主要是研究数据的采集和处理,或者说主要用于在线事务处理。然而,随着事务数据的逐渐积累和增加,如何充分利用现有数据的价值,成为了数据库技术的研究重点。今后,作为全球经济及技术管理者的信息工作者必须重视数据的战略价值,所面对的问题不是简单地处理数据而是如何充分地使用数据。 本章通过具体的数据仓库产品,研究数据仓库的技术和特征。 本章的学习目标 理解数据仓库的概念和特征 理解和掌握数据挖掘技术的特点 理解和掌握数据中心库技术的特点 了解数据仓库的支持工具的特点 理解和掌握数据仓库的实现步骤 理解数据的粒度、分割和元数据的特点 主要内容 15.1 概述 15.2 数据挖掘和数据中心库 15.3 数据仓库的支持工具 15.4 数据仓库的实现步骤 15.5 数据的粒度、分割和元数据 15.6 本章小结 15.1 概述 数据仓库就是面向主题的、综合的、不同时间的、稳定的数据集合,用于支持经营管理中的决策制定过程。也就是说,数据仓库是一个处理过程,该过程从历史的角度组织和存储数据,并能集成地进行数据分析。简而言之,数据仓库就是一个大的数据库,存储了该公司所有业务数据,例如,在线事务处理(OnLine Transaction Processing,OLTP)系统中获取的综合数据,这些数据可能驻留在许多不同的数据源中。这些数据源可能是文档、层次型数据库、网络结构化的数据库、反向列表数据库、关系型数据库或者更常见的由上述系统组成的混合系统。 数据仓库特征 数据仓库可以辅助决策支持和在线分析处理(OnLine Analytical Processing,OLAP)应用程序。 数据仓库除了具有传统数据库管理系统的共享性、完整性、数据独立性外,还具有下列特征:统一性和一致性;面向主题;历史性;只读性。 15.2 数据挖掘和数据中心库 数据挖掘技术和数据中心库技术是数据仓库体系的重要组成部分。 下面详细介绍数据挖掘技术和数据中心库技术。 数据挖掘技术 对大型的、复杂的、信息丰富的数据集的理解实际上是所有的商业、科学、工程领域的共同需要,在商务领域,公司和顾客的数据逐渐被认为是一种战略资产。在当今的竞争世界中,吸取隐藏在这些数据后面的有用知识并利用这些知识的能力变得愈加重要。 运用基于计算机的方法,包括新技术,从而在数据中获得有用的知识的整个过程,叫做数据挖掘。 数据挖掘是一个反复迭代的过程 数据挖掘的基本任务 分类——预测学习功能的发现,此功能将一个数据项分到几个预定义类中的一类。 回归——预测学习功能的发现,此功能将一个数据项映射到一个真值预测变量。 聚类——一种普遍的描述性任务,寻求以确定有限的一组类或簇来描述数据。 总结概括——一项附加的描述任务,寻找对集或子集数据的简单描述的方法。 关联建模——发现描述变量之间或者数据集或数据集的一部分的特征之间的重要的相关性的本地模型。 变化和偏差检测——发现数据集中最重要的变化。 数据中心库 微软及其数据仓库联盟伙伴开发了一系列的存储扩充工具以提供共同的开发结构。这种存储鼓励信息的共享——例如数据结构、数据元、数据传输,这些信息均被应用于数据仓库中。其它的数据元模型也能从开放式设计过程中产生,并且早期的模型还可以得到改进。共享的存储器增加了数据仓库和不同开发商所用工具之间的内部操作能力。用户可从方便的系统管理、更多可选的兼容产品以及基于存储器的先进特性中收益。新型的存储器扩充通过给数据库和数据设计及分析工具销售商提供开放的、通用的结构,从而扩展了设计仓库的市场。为了提供更成功的数据仓库和数据交易功能,数据元的集成是当前最重要的任务。当主要的数据转换服务规定可用,并且在线分析处理延伸到存储器的开放式信息模型之后,开放的设计检验阶段便开始了。这些重要的扩展是指将几个信息模型增加到数据中心库内,从而可给开发者提供更多可选的兼容产品和数据仓库系统的先进特性。 微软数据中心库提供了一个通用的位置,可以用来存放对象和对象之间的关系。 15.3 数据仓库的支持工具 数据仓库的实现最终由许多支持工具来完成。在Microsoft SQL Server中,提供了一些实现数据仓库的支持工具。这些工具包括OLAP服务、数据转换服务、PivotTable服务、英语查询工具等。 下面主要研究OLAP服务、数据转换服务、PivotTable服务的特点。 OLAP服务 OLAP描述的是一种多维数据服务(这里指的维是指人们观察客观世界的角度,例如时间、地域、业务等),这种服务的设计目的是保证分析员、经理和决策者针对特定的问题,通过快速、一致、交互式的实时数据访
您可能关注的文档
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第6章 高级查询.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第7章 索引和视图.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第8章 数据完整性约束.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第9章 关系规范化理论.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第10章 实体联系模型.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第11章 数据库设计.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第12章 事务与并发控制.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第13章 数据库恢复技术.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第14章 查询处理与优化.ppt
- 数据库系统教程 教学课件 作者 何玉洁 李宝安 第15章 数据库技术的发展.ppt
- 数据库系统原理与应用教程(第二版) 教学课件 作者 7 302 0815 6 ch16.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch01.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch02.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch03.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch04.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch05.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch06.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch07.ppt
- 数据库系统原理与应用教程(第三版) 教学课件 作者 978 7 302 17185 0 ch08.ppt
- 数据库系统原理与应用实训教程——PowerBuilder & SQL Server版电子教案 第11章 窗口及窗口上的控件.ppt
原创力文档


文档评论(0)