- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
成就直达号的大数据引擎技术专场
百度OLAP系统实践
目录
• OLAP背景介绍
• Palo整体架构
• Palo关键技术
• Palo对外开放
什么是OLAP
• Online Analytical Processing
– Analytical Processing vs. Transactional Processing
– Online vs. Offline (Interactive vs. Batch)
OLTP vs. OLAP
OLTP OLAP
面向应用 日常交易处理 明细查询,分析决策
访问模式 简单小事务,操作少量数据 复杂聚合查询,可以过大量数据
数据 当前最新数据 历史数据
数据规模 GB TB ~ PB
数据更新 实时更新 批量更新
数据组织 满足3NF 反范式,星型模型
Online vs. Offline
OLAP - Interactive Data Analysis
结构化数据的 文本数据的 各类数据的
简单查询分析 简单查询分析 复杂分析
Multidimensional
Reporting Text Analysis Data Mining
Analysis
SQL DB
Search DB Mining DB
(PALO)
OLAP应用-在线报表
OLAP应用-多维分析
商业产品
产品 简介 技术特点 收购情况
Netezza 2000年在美国成立 软硬一体机 2010年9月20日,IBM出资17.8亿美
Netezza TwinFin 采用FPGA数据过滤代替索引 元收购
Greenplum 2003年在美国成立 行存 + 列存 2010年7月6日,EMC出资3亿美元收
Greenplum Database Shared-Nothing集群 购
Vertica 2005年在美国成立 列存 2011年2月,HP出资3.5亿美元收购
Vertica Analytic Database Shared-Nothing集群
Aster Data 2005年在美国成立 SQL-MapReduce 2011年7月6日,Teradata出资2.63亿
nCluster Shared-Nothing集群 美元收购
ParAccel 2005年在美国成立
文档评论(0)