- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用OES构建OLAP分析系统
摘要:如何实现对企业海量数据的分析,为决策提供有价值的信息,基于多维数据库的OLAP系统是企业管理者的最佳选择。什么是OLAP,如何构建OLAP系统?本文详细阐述了OLAP基本概念、OLAP体系结构以及构建OLAP的解决方案——OES的详细开发过程。
关键词:OLAP、OES、多维数据库
联机分析处理(OLAP)最初是由关系数据库之父E.F.Codd于1993年提出的,它是用于对数据仓库进行查询的一种技术,适用于对海量数据进行快速的分析处理。它与传统的联机事务处理(OLTP)的根本区别在于OLTP是事务型,具有实时性、事件驱动等特点,适用于关系型数据库,它为关系型数据库提供常用功能;而OLAP则是分析型,是一个用户接口概念,而不是一种数据存储技术,具有多维性、可钻取性、旋转性、多视图模式等特点。
一、OES体系结构:
OES(Oracle Express Server)是Oracle公司对OLAP系统提出的一种解决方案,它是一个单一的、集成化的软件结构,具有超强的分析能力和良好的性能。使用OES,用户就可以对数据进行切片、切块、任意钻取等在OLTP下难以实现的各种分析功能的操作。而且Oracle Express具有友好的用户界面以及图表分析能力。与Oracle数据库服务器一样,Oracle Express服务器也可以在Windows NT、UNIX各种产品等多种硬件平台上运行。
Oracle Express数据模型是一种多维化的数据模型,它是一种关于诸如数值、数目等数字化数据的一种模型,与关系模型相比,多维模型支持数据分析能力更强。Oracle Express中数据都是以多立方体(Multicube)的模式存放于多维数组中,超立方体就是用户所要分析的数据集合的内容,这种存储方式具有很强的灵活性和旋转性,能够提供高水平的多维视图,大大提高了分析效率;其主要元素就是“维”、“变量”、“公式”、“关系”、“层次”等,其详细定义为:
维(Dimension)――在Express中,一系列维的组合就能够对在变量中的数据或通过公式得出的数据加以组织并索引。以超市销售为例,有一些因素会影响他的销售业务,如商品、时间、商店,更具体如品牌、月份、地区等。对某一给定的商品,也许他想知道该商品在哪个商店和哪段时间的销售情况;对某一商店,也许他想知道哪个商品在哪段时间的销售情况;在某一时间,也许他想知道哪个商店哪种产品的销售情况;这里,商店、时间和产品都是维。各个商店的集合是一维,时间的集合是一维,商品的集合是一维。 “维”是一个典型的层次结构,可以具有多个层次,以时间维为例,它可以分为“年”、“季度”、“月”、“日”等多个层次,OES中存在已经定义好的时间维数据模型(Time)。
变量(Value)――也称为“事实”,通常代表用户分析中需要看到的一些数据,如销售额、销售数量等,但也可以是描述型变量,如产品标签等文本化数据。强烈建议所有变量都定义为数值型,否则就不能进行图形化分析。仍以超市为例,该超市某一种产品的销售价格、销售数量就要定义为变量。变量要受到维的限制,本例中的销售价格、销售数量可能要受到商店、商品、时间等维的限制,这些限制该变量的维值,就是分析该变量是所有的查询条件。
公式(Formula)――公式就是通过动态计算而导出的一些数据项。与变量不同的是,公式并不进行存储,而是在程序运行时候才被激活,程序结束时公式也就从内存中删除。以上述超市为例,如果要统计该超市的某一产品,某一时间段的销售额,那么就可以定义一个公式销售额=销售价格×销售数量,这样变量就和所生成的公式受到共享维的限制。
关系(Relation)――关系就是将某一维值与其他维的维值连接起来,最常见的关系类型有层次(Hierarchy)、上下、一对多等。使用这些关系,Oracle Express就可以动态执行聚合和任意选定限制范围。
层次(Hierarchy)――层次是维值的一种组织方式,它是多维数据分析系统提供钻取功能的基础。如图1所示的商品层次结构,它将产品分成四个层次(Level):
了解了Oracle Express的数据模型以后,下面再介绍一下OLAP多维数据分析中经常使用的术语:
切片、切块(Slice)――在多维数据分析系统中,数据通常都是以多立方体的格式进行存储,这样按照二维可以进行切片,按照三维可以进行切块,通过切片和切块就非常容易地得到所需要的数据。如上述超市例子中,通过对“商店、商品、时间”三维立方体中进行切片和切块操作,就可
以得到各商店、各商品的销售情况。
聚合(Roll up)――聚合是指将维值分层中子层的数据进行累加到父层中的过程,通常是从最低层开始逐层向上进行累积。
钻取(Drilling)――钻取就是将一条概要性的
您可能关注的文档
- NEFAB整体包装解决方案全球性合作伙伴.doc
- NetWeaver应用服务器基础.doc
- NIT2011年9月份培训试题.doc
- nl采购管理控制程序0801.doc
- NOSA体系知识培训.ppt
- NY项目供应商审核表.doc
- OEM产品供应商管理评审办法.doc
- OEM产品工厂检查要求.ppt
- OH-QS-055 S.L REF进料检验规范.doc
- OH-QS-058 ND DM REF进料检验规范.doc
- 2025年老河口市人民法院劳务派遣人员招聘(3人)考前自测高频考点模拟试题附答案详解(模拟题).docx
- 2025年绥化市绥棱县事业单位招聘工作人员(55人)模拟试卷附答案详解(精练).docx
- 2025年度国务院国资委纺织机关服务中心招聘(1人)考前自测高频考点模拟试题含答案详解(a卷).docx
- 2025浙江省发展和改革委员会下属事业单位招聘6人模拟试卷含答案详解(夺分金卷).docx
- 2025山东德州市武城县教育系统引进第二批高层次人才20人笔试备考试题附答案详解(名师推荐).docx
- 2025年本溪市桓仁满族自治县教育系统事业单位校园招聘教师笔试备考试题及答案详解(夺冠系列).docx
- 2025年南宁市卫生健康委员会所属事业单位招聘医药卫生类急需紧缺模拟试卷及答案详解(精选题).docx
- 2025年巫山县卫生健康委员会县属医疗卫生事业单位考调工作人员的笔试备考试题含答案详解(典型题).docx
- 2025年北京市东城区卫生健康委所属事业单位第一次招聘(396人考前自测高频考点模拟试题附答案详解(.docx
- 2025年锡林浩特市大数据领域人才引进(1人)考前自测高频考点模拟试题含答案详解.docx
文档评论(0)