OLAP技术在数据分析中应用.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OLAP技术在数据分析中应用

OLAP技术在数据分析中应用   摘要:首先介绍了OLAP的概念、功能特征,然后通过实例对多维数据库的概念、层次关系和多维数据分析的主要操作进行了详细描述。最后,以ORACLE公司的Hyperion产品作为多维数据库分析的平台,通过对一大型能源集团公司的财务预算系统中的预算数据进行分析,介绍了OLAP技术方法的实际应用,总结了OLAP技术在数据分析工作中的优势。   关键词:联机分析处理;多维数据库;数据分析;甲骨文产品;财务预算系统   中图分类号:TP392 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-03   OLAP(On-Line Analytical Processing,即联机分析处理)是一种多维数据库技术。这种技术的设计目的是针对特定问题的实时数据访问和分析,并且提供直观易懂的查询结果。还有一种处理技术OLTP(on-Line transaction processing,即联机事务处理),与OLAP不同,OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。   1 OLAP技术介绍   1.1 OLAP技术的发展背景   60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,E.F.Codd提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP技术正是为了满足决策管理的需求而产生的。   1.2 OLAP特征   OLAP的技术核心是维(Dimension)这个概念。“维”是指一种视角,是一个判断、说明、评价和确定一个事物的多方位、多角度、多层次的条件和概念。通过把一个实体的多项重要的属性定义为多个维,使用户能对不同维上的数据进行动态的多维快速访问和分析。包括:在维之间、成员之间交叉组合分析;对连续时间段进行趋势分析;将数据切片从不同切面比较数据;向下钻取到组合数据的更深层观察细节数据;向上上卷到细节数据的更高层观察汇总数据.因此OLAP也可以说是多维数据分析工具的集合。由此可以得出OLAP的四个特征:多维性、快速性、可分析性和信息性。   1.3 多维数据的概念及层次关系   关系数据库是围绕一条一条“记录”而形成的。多维数据库的技术核心是“维”,类似于数组。下面举例说明:NBA(National Basketball Association)联盟有三种收入来源(转播、门票和广告),下表是其中两支NBA球队(LAKERS,KINGS)的销售收入,其中表1是关系表,表2是根据每支球队的销售来源转化成的多维表。   通过上图可以看出,表2中表达的数据关系更直观。在多维数据库中,通常将“球队”定义成“组织”(Entity)维,将“收入来源”定义为“业务方向”(Business)维,销售额定义为“科目”(Account)维。表2从组织维和业务方向维展示了销售收入状况。其中,“Entity”为维度,球队名称:LAKERS,KINGS为维度成员,即维值。“维”具有层级关系,如父子关系,兄弟关系等。如本例中,Entity和LAKERS的关系就是父子关系,LAKERS和KINGS的关系为兄弟关系。若在Entity和LAKERS之间定义了其他维值,如NBA、WEST(西部)和Pacific Division(太平洋赛区),即:Entity-NBA-WEST-Pacific Division-LAKERS,那“Entity”与“LAKERS”的层级关系就变成了祖辈与后代的关系。   1.4 多维数据分析的操作   OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through等,对数据进行剖析,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入分析包含在数据中的信息。   钻取是改变维的层次,变换分析的粒度。它包括向上钻取(roll up)和向下钻取(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。旋转是变换维的方向,即在表格中重新安排维的放置(即行列互换)。  

您可能关注的文档

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档