数据挖掘第四章联机分析处理.ppt

  1. 1、本文档共116页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 在线分析处理OLAP 联机分析处理(OLAP) 4.1 从OLTP到OLAP 4.2 OLAP的特征及衡量标准 4.3 OLAP实施 4.4 基于多维数据库的OLAP实现 4.5 基于关系数据库的OLAP实现 4.6 两种技术间的比较 4.7 OLAP产品介绍及选择 4.8 OLAP的新发展及在我国的应用展望 联机分析处理(OLAP) 决策支持中的典型问题: 东部地区和西部地区今年6月份和去年6月份在销售总额上的对比情况,并且销售额按10万-20万、20万-30万、30万-40万,以及40万以上分组 特点: 多角度 多层次 访问大量数据 快速回答 1993年, E.F.Codd提出了OLAP的概念,利用专门的数据综合引擎和直观的数据访问界面,使得系统能在很短的时间内响应用户的复杂查询 Arborsoft发布了OLAP软件 联机分析处理(OLAP) 4.1 从OLTP到OLAP 4.2 OLAP的特征及衡量标准 4.3 OLAP实施 4.4 基于多维数据库的OLAP实现 4.5 基于关系数据库的OLAP实现 4.6 两种技术间的比较 4.7 OLAP产品介绍及选择 4.8 OLAP的新发展及在我国的应用展望 4.2 OLAP的特征及衡量标准 Codd 认为关系数据库从一开始就未打算提供强大的数据合成、分析能力(或者说多维数据分析的能力),这些功能总是由各类前端工具来完成, 它们与关系数据库相辅相成,因此RDBMS仍然是当今最适合企业数据管理的技术。 Codd所指的这些前端工具即指OLAP类产品。 4.2 OLAP的特征及衡量标准 九十年代初期E.F. Codd提出了OLAP的概念、特征,同时给出了OLAP产品评价的12条基本准则。 至今OLAP的概念已经在商业数据库领域得以广范使用,OLAP的特征也得到了验证和确认。 作为一个原则——OLAP产品应能支持OLAP所具有的特征,已经得到广泛任可。 从实践中来看,这12条准则可以作为评价和购买OLAP产品的标准,并对其中的一些实现作了进一步的论述。 4.2 OLAP的特征及衡量标准 4.2 OLAP的特征及衡量标准 这种多维模型可以使最终分析以比单一维模型更简单、直观的方式操纵多维数据。 例如:通过对多维数据模型进行“切片和切块”和维旋转就可以轻松地完成传统的操作方法必须用极大的时间和代价才能完成的工作。 表6-2为一个四维(包括统计指标自身)报表,分析人员可以根据需要对各维进行旋转,汇总以及合并操作(如将季度维合并,变为三维报表等) 联机分析处理(OLAP) 4.1 从OLTP到OLAP 4.2 OLAP的特征及衡量标准 4.3 OLAP实施 4.4 基于多维数据库的OLAP实现 4.5 基于关系数据库的OLAP实现 4.6 两种技术间的比较 4.7 OLAP产品介绍及选择 4.8 OLAP的新发展及在我国的应用展望 4.3 OLAP实施 OLAP服务器的构建基础是数据仓库或基层数据库, 数据仓库既包括基层数据库的操作细节数据,又包括综合性数据。 由于OLAP是面向分析和管理决策人员的, 决策人员大多关心的是综合性数据以便从更高层次、总的视角来了解数据。 4.3 OLAP实施 因此 ,OLAP服务器的设计重点在于如何组织数据仓库中的综合性数据, 如何满足前端用户的多维数据分析需要。 如果企业的数据仓库尚未建立,也可直接从基层数据库中提取数据。 联机分析处理(OLAP) 4.1 从OLTP到OLAP 4.2 OLAP的特征及衡量标准 4.3 OLAP实施 4.4 基于多维数据库的OLAP实现 4.5 基于关系数据库的OLAP实现 4.6 两种技术间的比较 4.7 OLAP产品介绍及选择 4.8 OLAP的新发展及在我国的应用展望 4.4 基于多维数据库的OLAP实现 (MD-OLAP) 多维数据库可以直观地表现现实世界中的“一对多”和“多对多”关系。例如,我们希望存放一张销售情况表,假设有三种产品(冰箱、彩电及空调),它们在三个地方(东北、西北和华北)销售。用关系数据库来组织这些数据如表6-4(A), 而用多维数据库则如表6-4(B): 4.4 基于多维数据库的OLAP实现 除了表达清晰,占用存储少外,多维数据库还有一个优点: 综合速度快。 数据可以直接按行或列累加,并且由于MDDB中不象关系表里那样重复地出现产品和地区信息,因此其统计速度远远超过RDBMS,数据库记录数越

文档评论(0)

asd3366 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档