- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hadoop大数据处理讲义-c10. hive_pig
海量数据处理中的云计算
C10. Hive Pig
北京邮电大学信息与通信工程学院
刘军(liujun@ )
2014年春季学期
新闻时事
第2页
新闻时事
第3页
新闻时事
第4页
新闻时事
第5页
新闻时事
第6页
基于Hadoop的海量数据处理框架
数据分析员 vs. 程序员
– 数据抽象
– 操作方式
– 执行环境
第7页
目录
Hive
– 由来
– 架构
– HQL及实例
– 使用UDF扩展Hive
– Hive使用中的技巧
Pig
– 由来
– 架构
– Pig Latin及实例
– 使用UDF扩展Pig
– Pig使用中的技巧
第8页
目录
Hive
– 由来
– 架构
– HQL及实例
– 使用UDF扩展Hive
– Hive使用中的技巧
Pig
– 由来
– 架构及实现
– Pig Latin及实例
– 使用UDF扩展Pig
– Pig使用中的技巧
第9页
Hadoop数据分析-Hive
来源 : Ashish Thusoo, Joydeep Sen Sarma, et al., Facebook,
“Hive: A Warehousing Solution over A Map-Reduce
Framework”, Proceedings of the VLDB Endowment, Aug. 2009.
Why Hive ?(/ )
– Hive is a data warehouse system for Hadoop that facilitates easy data
summarization, ad-hoc queries, and the analysis of large datasets
stored in Hadoop compatible file systems. Hive provides a
您可能关注的文档
- 045 金融投资大数据实践分享.pdf
- 048 数据资产管理——大数据时代的掘金术.pdf
- 057 社交网络发展的新动力:大数据与众包.pdf
- 064 openkn——网络大数据时代 的知识计算引擎.pdf
- 054 大数据分析挖掘技术在电商的应用-黄晖.pdf
- 070 京东何刚---京东大数据实践.pdf
- 70bj019-2011_焦炭塔制造、检验及验收工程技术条件.pdf
- 70bj013-2011 15crmor反应器制造及验收工程技术条件.pdf
- 065 魏凯-大数据技术与产业综述.pdf
- 074 网宿孙孝思--cdn彰显大数据洞察力.pdf
- 注册验船师高频真题题库2025.docx
- 注册验船师高频题库带解析2025.docx
- 注册验船师考试必备资料2025.docx
- 注册验船师精选题库带分析2025.docx
- 注册验船师考前冲刺必刷题附答案2025.docx
- 新高考生物二轮复习讲练测第10讲 人体的稳态与免疫调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第7讲 遗传的基本规律与伴性遗传(检测)(原卷版) .docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(检测)(原卷版).docx
文档评论(0)