- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.2.2 OLAP的定义和相关概念 (2)OLAP的相关概念 变量:变量是数据的实际意义,即描述数据“是什么”。一般情况下,变量总是一个数值度量指标,例如:“人数”、“单价”、“销售量”等都是变量。 维:维是人们观察数据的特定角度。是考虑问题时的一类属性,属性集合构成一个维,如时间维、产品维等。 维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。例如,描述时间维时,可以从日期、月份、季度、年等不同层次来描述。。 维成员:维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成。 多维数组:一个多维数组可以表示为:(维l,维2,…,维n,变量),用维和变量的组合表示,如(产品,地点,时间,销售量)。 数据单元:多维数组的取值称为数据单元。当多维数组的各个维都选中一个维成员,这些维成员的组合就惟~确定了一个变量的值。如(电脑,广州,2006年lO月,1000台) 2.2.3 OLAP与OLTP比较 ? 数 ? ? 据 ? OLTP OLAP 数据来源 数据库原始数据 数据库数据或数据仓库数据 数据类型 细节性数据 综合性数据 更新次数 经常更新 不可更新、周期刷新 用户数量 数量大 数量较少 面向对象 面向操作人员 面向决策人员 功能 日常操作处理 分析决策 数据库设计 面向应用 面向业务主题 存取 读/写数十条记录 读上百万记录 工作单位 简单的事务 复杂的查询 用户数 上百个 上千个 数据库大小 100MB-GB 10OGB-TB 联机分析与人们较为熟悉的联机事务处理(OLTP)相比有很大不同,联机分析处理是决策人员和高层管理人员对数据仓库进行信息分析处理,而OLTP是操作人员和底层管理人员利用计算机网络对数据库中的数据进行查询、增加、删除、修改等操作,以完成事务处理工作;OLAP是面向分析的,而OLTP是面向应用的;OLAP其历史的数据和经综合提炼的数据均来自OLTP所依赖的底层数据库;LAP的数据比OLTP的数据多了数据的多维化和预综合处理等操作;另外,OLAP的前端产品的界面风格和数据访问方式是与OLTP不同的,OLTP多为固定的表格,查询和数据显示也较固定规范,而OLAP则采用便于非数据处理专业人员理解的方式。 2.2.4 OLAP系统结构 Codd提出OLAP的12条准则来描述OLAP系统。 1)OLAP模型必须提供多维概念视图;2)透明性准则; 3)存取能力推测;4)稳定的报表能力; 5)客户/服务器体系结构;6)维的等同性准则; 7)动态的稀疏矩阵处理准则;8)多用户支持能力准则;9)非受限的跨维操作; 10)直观的数据操纵;11)灵活的报表生成; 12)不受限的维与聚集层次 2.2.6 OLAP多维数据分析 OLAP提供了对数据的多维分析方法,包括切片(Slice)、切块(Dice)、旋转(Rotate)、上翻(Drill-up)、下钻(Drill-down)等分析动作。 (1)切片:在多维数组的某一维上选定一个维成员,得到多维数组的一个子集,然后对这个子集进行统计分析。 (2)切块:在多维数组的某一维上选定某一区间的维成员,得到多维数组的一 然后对这个子集进行统计分析。 (3)旋转:改变一个报告或页面显示的维方向。例如,将行和列交换。 (4)上翻:将较细节的数据汇总成较综合的数据是从特殊到一般的分析过程。沿着维的概念分层向上攀升, (5)下钻:由较综合的数据分解得到较细节的数据,沿着维的概念分层向下或引入新的维,是从一般到特殊的分析过程. 【本章小结】 本章主要介绍数据仓库和联机分析处理处理的概念。数据仓库(Data Warehouse,DW)、联机分析处理(On Line Analytical Processing,0LAP)、数据挖掘(Data Mining,DM)是商务智能的三大技术支柱,其中数据仓库是商务智能的基础。数据仓库是一个更好地支持企业或组织的决策分析处理的数据集合,它有面向主题、集成、相对稳定、随时间不断变化四个特性。联机分析处理是以海量数据为基础的复杂分析技术。它支持各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理,并且能以直观易懂的形式将查询和分析结果展现给决策人员。数据挖掘是从海量数据中,提取隐含在其中的、人们事先不知道的但又可能有用的信息和知识的过程。 联机分析处理和数据挖掘虽然是数据仓库上获取两种不同目标的数据增值技术,但这两类技术如果能够在一定程度上融合,会使分析操作智能化,使挖掘操作目标化,从而全面提升商务智能技术的实用价值。它们之间的关系
文档评论(0)