[外文翻译XJY.doc

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[外文翻译XJY

数据仓库和OLAP技术的概况数据仓库和联机分析处理(OLAP)决策支持的重要元素已日益成为产业集中的数据库现在可以使用商业产品和服务和现在有产品在这些领域所有的主要数据库管理系统供应商相比传统的在线事务处理应用程序决策支持对数据库技术有一些截然不同的需求本文概述了数据仓库和OLAP技术,重点是他们的新要求我们描述后端工具提取、清洁和加载数据到数据仓库;多维数据模型的典型OLAP;前端客户查询和数据分析工具;服务器扩展有效的查询处理;和工具对元数据管理和仓库管理除了测量状态的艺术,本文也指出一些有前途的研究问题,其中的一些相关问题,数据库研究界已工作多年但其他才刚刚开始得到解决。这是作者在1996年VLDB会议上提出基于一个教程概述。引言数据仓库是决策支持技术的集合,知识工作者(主管,经理,分析师)做出更好和更快的决策。过去三年在提供产品和服务的数量以及采用这些技术的行业爆炸式增长。根据数据仓库元集团市场,包括硬件、数据库软件和工具,预计将从20亿年的1995美元增长到80亿年的1998美元。数据仓库技术已经成功地部署在许多行业:制造业(订单发货和客户支持),零售(用户分析和库存管理)、金融服务(要求分析,风险分析信用卡分析和欺诈检测)、运输(车队管理),电信(电话分析和欺诈检测)、公用设施(电力使用情况分析),和医疗(分析结果)。介绍了数据仓库技术的路线图,专注于数据仓库的特殊要求在数据库管理系统(dbms)。数据仓库是一个面向主题的、集成的、,主要用于非易失性数据收集在组织决策通常,数据仓库是独立于组织维护操作数据库。这样做有很多原因。数据仓库支持联机分析处理(OLAP)的功能和性能要求这非常不同于联机事务处理(OLTP)应用程序支持的传统操作数据库。OLTP应用程序通常自动化文书数据处理任务,如订单输入和银行交易,是一个组织的实用的日常操作。这些任务的结构和重复,由短,,独立的生产。通常在他们的主键事务需要详细、最新数据和读取或更新几(数万)记录访问。操作数据库往往是数百兆字节大小。数据库的一致性和可恢复性至关重要,事务最大化的关键性能指标因此,数据库是为了反映已知应用程序的操作语义,而且,特别是并发冲突降到最低。 相反,数据仓库是决策支持的目标。历史、总结和整合数据比详细的更重要。因为数据仓库包含整合数据,也许从几个操作数据库,可能很长一段时间,他们往往是数量级大于操作数据库企业数据仓库将数百gb字节大小。查询密集型工作负载主要是特别复杂的查询可以访问数百万条记录并执行大量的扫描,连接和聚集。查询和响应时间比更重要。促进复杂的分析和可视化、数据仓库通常多维建模。例如,在一个销售数据仓库,销售时间、销售地区、销售人员和产品可能感兴趣的一些维度。通常,这些维度层次;销售时间可能是组织为层次结构,产品作为-种类-产业层次结构。典型的OLAP操作包括汇总(增加聚合的水平)和向下钻取(减少聚合的水平或增加细节)以及一个或多个维度层次结构,片和骰子(选择和投影和枢轴(调整数据的多维视图)。考虑到操作数据库是支持OLTP工作负载,试图执行复杂的OLAP查询操作数据库将导致不可接受的性能。 此外,决策支持需要从操作数据库的数据可能会丢失;例如,理解趋势或预测需要历史数据,而操作数据库只存储当前数据。决策支持通常需要合并来自许多异构数据源的数据:这些可能包括外部资源,如股市提要,除了几个操作数据库。不同来源可能包含不同的数据质量,或使用不一致表示,代码和格式必须一致。最后,支持OLAP的多维数据模型和典型操作需要特殊的数据组织、访问方法,和实现的方法,而不是通常所提供的商业dbms OLTP的目标。正是因为这些原因,数据仓库实现分开操作数据库。数据仓库可能是标准上实现或扩展关系型,称为关系OLAP(ROLAP)服务器。这些服务器假定数据存储在关系数据库中,和他们支持扩展SQL和特殊的访问和实现方法有效地实现了多维数据模型和操作。相比之下,多维OLAP(MOLAP)服务器是服务器直接将多维数据存储在特殊的数据结构(如。、数组)和实现OLAP操作对这些特殊的数据结构。有更多比选择构建和维护数据仓库OLAP服务器和定义一个模式和一些复杂的查询仓库。不同的架构选择存在。许多组织希望实现一个集成的企业仓库,所有科目(如收集信息。、客户、产品、销售、资产、人员)横跨整个组织。然而,建立一个企业仓库是一个漫长而复杂的过程,需要广泛的业务建模,可能需要许多年才能成功。相反,一些组织是解决数据集市的部门专注于选定的对象(如子集。营销数据集市可能包括客户、产品、销售信息)。这些数据集市使更快的推出,因为它们不需要企业范围的共识,但他们可能会导致复杂的集成问题,从长远来看,如果没有一个完整的商业模式发展。在第2部分中

文档评论(0)

xiaoyi2013 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档