- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hive编程入门-weibo
Hive 编程入门
集团技术平台部-核心系统-海量数据天
照
1
Agenda
• 简介
• 部署/配置
• Hive QL 编程
• Hive QL vs. SQL
什么是Hive ?
建立在 Hadoop 上的数据仓库基础构架
什么是Hive ?
• Hadoop
– Open Source MapReduce framework
– Sponsored by Yahoo!
• Hive
– 支持SQL语义的大规模数据分析工具
– 离线/数据仓库应用
– File Processor
– Sponsored by Facebook
为什么选择Hive ?
• 为超大数据集设计的计算/扩展能力
– based on Hadoop
• 支持SQL like查询语言
• 统一的元数据管理
为什么选择Hive ?
• 简单
select word, count(*)
from (
select
explode(split(sentence. )) word
from article
) t
group by word
整体架构
Oracle 备库 MySQL 备库 日志系统 爬虫数据
DataExchange DataSync TimeTunnel
统
系
度 Gateway Servers
调
网 Hadoop Cluster:云梯1
天
Map Reduce Java Streaming Jobs Hive Jobs
Jobs
数据平台 搜索 广告 BI 支付宝 口碑 B2B 云梯2
数据魔方 量子统计 淘数据 推荐系统 搜索排行 … 7
Architect
• Client端应用程序
• 元数据
• 编程接口
配置/部署
• 客户端
• 元数据服务器
客户端部署
• 依赖
您可能关注的文档
- HEC-RAS简体中文教程(pdf).pdf
- HES D6501英文-电泳标准.pdf
- HG20592-2009法兰(详细规格尺寸表).pdf
- HGO1601601V2-F-LWH-LSV_中文版_.pdf
- hi3515海思原版原理图.pdf
- HHZ_新目录.pdf
- Highcharts&Highstock中文API.pdf
- High Speed Cable 高频基本知识简介.pdf
- Hirschmann交换机配置手册(新).pdf
- HFSS和CST电磁媒质色散曲线dispersion diagram研究方法.pdf
- 吉安县公开招聘专职文明实践员笔试备考试题及答案解析.docx
- 2025重庆枫叶国际学校招聘教师笔试备考试题及答案解析.docx
- 游机队电玩自制联网教程-tplink.pdf
- 2025重庆新华出版集团招聘1人笔试模拟试题及答案解析.docx
- 2025宜宾高新丽雅城市产业发展有限公司公开招聘笔试模拟试题及答案解析.docx
- 2025云南保山市龙陵县勐糯镇人民政府招聘合同制专职消防员1人笔试模拟试题及答案解析.docx
- 11.1生活中常见的盐 九年级化学人教版下册.pptx
- 6.1法律保护下的婚姻 高二政治《法律与生活》课件(统编版选择性必修2)(新版).pptx
- 文昌市中小学教师校园招聘29人笔试模拟试题及答案解析.docx
- 10.1.5 常见的酸和碱(第5课时)课件-九年级化学人教版下册.pptx
文档评论(0)