- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据与OLAP系统-信息通信学术期刊网
TOPIC 专题
大数据与OLAP系统
杜小勇,陈跃国,覃雄派
中国人民大学信息学院数据工程与知识工程教育部重点实验室 北京 100872
摘要
数据时代,人们迫切希望在由普通机器组成的大规模集群上能实现高性能的OLAP,然而系统性能的挑战巨
系统性能不断提升。在综述OLAP技术发展的基础上,重点对几个有代表性的SQL on Hadoop系统进行了测
试分析,并展示了这类系统的性能特点。可以预见,未来在低成本的大数据OLAP市场,这类系统会占有重要
位置。
关键词
大数据;OLAP;SQL分析;SQL on Hadoop
Big Data and OLAP Systems
Du Xiaoyong, Chen Yueguo, Qin Xiongpai
Key Laboratory of Data Engineering and Knowledge Engineering,
School of Information, Renmin University of China, Beijing 100872, China
Abstract
OLAP (online analytical processing) is a key technology of business intelligence based on relational data. In big data era, people
want to achieve high performance OLAP using a large cluster of ordinary nodes. However, the performance of such systems
is a big challenge. Recently, many SQL on Hadoop systems have been proposed to address this challenge. We have seen a
significant performance improvement of such systems. A survey of technology development of OLAP technologies was first
provided. Then, a study of the performance of three representatives SQL on Hadoop systems was focused on. Based on the
results, it is expected that such systems will play an very important role in the market of low cost OLAP analysis.
Key words
big data, online analytical processing, SQL analysis, SQL on Hadoop
2015005-1
BIG DATA RESEARCH 大数据
大、任务复杂的情况下往往是离线分析任
1 OLAP的前世今生 务。
本文重点围绕OLAP,探讨大数据对
数 据 分析 一 般 指为了从 数 据中获得 于OLAP系统的深刻影响。截至目前,它还
有价值的信息,而采用的诸如数据清理、 是商业数据分析(数据仓库技术)所依赖
建模、查 询、统计、挖掘、展示等操作过 的最为重要也最为核心的数据分析技术。
程,其产生的结果往往用于决策支持,是 使 用 S Q L 技 术 对
您可能关注的文档
- 基于BIM的停车场动态模型研究胡振中.PDF
- 基于CACTI的分布式ORACLE监控系统的设计与-计算机系统应用.PDF
- 基于B/s模式的防±水雨情整合查询系统研究-水资源与水工程学报.PDF
- 基于COM/DCOM技术的分布式监控系统实现-维普.PDF
- 基于CITYgreen模型的城森林管理信息系统的构建与-生态学杂志.PDF
- 基于DNSCurve的ONS安全机制-计算机应用与软件.PDF
- 基于DTS技术的电力系统异种数据库互联.PDF
- 基于Geodatabase模型的空间数据库设计方法-地球信息科学学报.PDF
- 基于GIS的区域农业规划空间数据库构建与应用-广东农业科学.PDF
- 基于Geodatabase的滑坡灾害空间数据库设计-灾害学.PDF
文档评论(0)