- 13
- 0
- 约3.24千字
- 约 25页
- 2018-01-04 发布于广东
- 举报
Python大数据开发2017年4月目录1.Hadoop Streaming2.Spark3.Hbase4.HiveImpalaMapRecude分布式计算框架MapReduce采用“分而治之”的思想,将计算任务抽象成Map和Reduce两个计算过程:A.把输入分割成不相关的若干键值(key1/value1)集合,这些键值会有多个map任务来并行处理。B.会对map的输出(一些中间键值对key2/value2集合)按照key2进行排序C.将属于同一个key2的所有value2组合分至一个reduce作为输入D.由reduce任务计算出最终结果并输入key3/value3Hadoop Streaming介绍MapReduce由Java开发,默认提供Java编程接口,所以一般用户Java程序编写,另外提供C++编程接口和Streaming框架。hadoop jar hadoop-mapreduce-examples.jar wordcount /input /outputHadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer。 hadoop jar hadoop-streaming.jar -input :输入文件路径 -output :输出文件路径 -mapper :用户自己写的mapper程
您可能关注的文档
- 内核基础与wubi.exe安装Ubuntu.doc
- 811电子技术(含模拟数字部分).pdf
- Android系统漏洞提权.pdf
- 微软等数据结构_+算法面试_100题全部答案集锦.pdf
- python学习交流.pdf
- (中文)Java环境变量配置教程.pdf
- 关于为什么计算机能读懂 1 和 0.docx
- VMWare安装Oracle RAC11g for Linux.pdf
- 大数据变现和广告市场—360(北理大数据公开课).pdf
- OCP考试指南-独家资料共享.pdf
- 建筑工程材料选择题:碳素结构钢与钢筋性能.pdf
- 眼部护理的跨文化比较.pptx
- 眼部护理:季节性变化的影响.pptx
- 眼部护理:男士与女士的特别需求.pptx
- 《快乐读书吧:在那奇妙的王国里》(课件)-2025-2026学年语文三年级上册统编版.pptx
- 眼部护理:眼部疲劳的预防措施.pptx
- 2026届九年级英语中考冲刺分层模拟卷与答案解析(质量检查版,含听力原文、作答空间和评分细则).docx
- 2026版项目投资合作协议书范本条款清单与签署风控提示模板(流程图).docx
- 2026版企业通用岗位结构化面试题库与综合评分表规范填写规范与审批台账模板(看板模板).docx
- 2026版企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板填写规范与审批台账模板(测算模型).docx
最近下载
- 2026年高考数学二轮复习专题05 导数压轴大题综合6大考向(重难)(天津)(解析版).docx VIP
- 长波通信原理课件PPT.pptx VIP
- 大学mooc理解马克思(南大)章节测验答案.docx
- 2026年上半年海南文昌市校园招聘事业单位人员38人备考题库(1号)含答案详解ab卷.docx VIP
- 【高清可复制】铁路旅客车站细部设计.pdf VIP
- 2025北京东城区五年级(下)期末数学试题及答案.pdf VIP
- 短波通信与短波通信系统.ppt VIP
- 江苏省小学科学实验知识竞赛题库附答案.doc VIP
- 蓝海华腾TS-I注塑机电液混合系统专用伺服驱动器V2.0.pdf
- 养老服务对感染老年人进行床旁消毒隔离具体流程 .pdf VIP
原创力文档

文档评论(0)