[管理学]数据挖掘与技术 ch2 OLAP.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]数据挖掘与技术 ch2 OLAP

第2章 联机分析处理 决策支持中的典型问题: 东部地区和西部地区今年6月份和去年6月份在销售总额上的对比情况,并且销售额按10万-20万、20万-30万、30万-40万,以及40万以上分组 特点: 多角度 多层次 访问大量数据 快速回答 2.1 联机分析处理概念 数据仓库是进行决策分析的基础,但还必须要有强有力的工具进行分析和决策,OLAP即是与数据仓库密切相关的工具产品。 OLAP的特性: 快速性:系统能在数秒内对用户的多数分析要求做出反应 可分析性:用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户所希望的方式给出报告 多维性:提供对数据分析的多维视图和分析 信息性:能及时获得信息,并且管理大容量信息 变量:变量是数据的实际意义,即描述数据“是什么”。例如:数据“10000”本身没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量,等等。一般情况下,变量总是一个数值度量指标,例如:“人数”、“单价”、“销售量”等都是变量,而数据“10000”则是变量的一个值。 维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面,称这多个描述方面为维的层次。一个维往往具有多个层次,例如描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了地理维的多个层次。 多维数组:维和变量的组合表示。一个多维数组可以表示为:(维1,维2,…,维n,变量)。如图所示的日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(地区,时间,销售渠道,销售额)。如果在图的基础上扩展一个维,产品维,就得到一个四维的结构。 数据单元(单元格):多维数组的取值。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。那么数据单元就可以表示为:(维1维成员,维2维成员,……,维n维成员,变量的值)。例如,在地区、时间和销售渠道上各取维成员“北京”、“2006年12月”和“批发”,就唯一确定了变量“销售额”的一个值(假设为10000),则该数据单元可表示为:(北京,2006年12月,批发,10000)。 随着数据库系统广泛应用,数据库系统记录和处理的数据越来越多,及时地记录和处理企业的各种业务数据,这些系统成为联机事务处理(OLTP)系统。数据库技术的广泛应用和技术的发展,人们已经不再满足于仅仅用数据库系统来记录企业的业务活动数据和对数据的简单处理,人们需要对企业业务活动的数据进行各种分析,以便发现企业业务趋势,这些系统称为联机分析处理(OLAP)系统。 1、OLTP OLTP(online transaction processing)联机事务处理是为在企业的全部业务事务发生时进行记录而设计的数据处理系统。OLTP系统的特征是许多并发用户动态地添加和修改数据。 0LTP系统可以进行各种事务的联机实时处理。例如,在银行系统中,OLTP系统可以用于银行储蓄的业务中存款和取款业务的实时处理。在民航、铁路、酒店等行业中,OLTP系统可以用于处理订票和订房等业务的实时处理。对于企业来说,OLTP系统可以用于生产业务(如订单、入库、出库)的实时处理。 一般来说,OLTP系统中的数据主要为组织支持如下事务: 支持主动添加和修改数据的大量并发用户。 能反映某个组织机构随时变化的状态,但不保存其历史记录。 包含大量的数据,其中包括用来验证事务的大量数据。 具有复杂的结构。 可以进行优化,以对事务活动做出响应。 提供支持组织机构日常使用的技术基础设施。 在OLTP系统中,个别事务能够很快地完成,并且只需访问相对较少的数据。OLTP系统旨在处理同时输入的成百上千的事务。 尽管OLTP系统擅长记录支持日常操作所需的数据,但是OLTP数据的组织方式不能很容易地为管理人员提供计划单位工作所需的信息。OLTP已经不能满足终端用户对数据库查询分析的需要。管理人员需要对信息进行汇总,以获取、分析影响单位趋势所需的信息。他们需要找出影响单位成功的、以及如何最好地对之进行调整的关键因素,这样来提高企业的成功。他们需要找出企业的工作负荷如何受季节和年度趋势的影响,以便可以预测完成将来的工作所需的职员和资源数量。这样,就出现了0LAP系统,用于对企业业务数据进行联机数据查询和数据分析。 2、OLAP 0LAP(online analytical processing)“联机分析处理”是使用多维结构为分析提供对数据的快速访问的一种最新技术。OLAP的源数据通常存储在关系数据库的数据仓库中。 联机分析处理(OLAP)系统的目的旨在处理发现企业趋势和

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档