- 19
- 0
- 约7.61千字
- 约 9页
- 2016-11-04 发布于重庆
- 举报
MapRedue作业过程
MapRedue作业. Hadoop 作业构成
.1 Hadoop作业执行流程
用户配置并将一个Hadoop作业提到Hadoop框架中,Hadoop框架会把这个作业分解成一系列map tasks 和reduce tasks。Hadoop框架负责task分发和执行,结果收集和作业进度监控。
下图给出了一个作业从开始执行到结束所经历的阶段和每个阶段被谁控制(用户 or Hadoop框架)。
下图详细给出了用户编写MapRedue作业时需要进行那些工作以及Hadoop框架自动完成的工作:
在编写MapReduce程序时,用户分别通过InputFormat和OutputFormat指定输入和输出格式,并定义Mapper和 Reducer指定map阶段和reduce阶段的要做的工作。在Mapper或者Reducer中,用户只需指定一对key/value的处理逻 辑,Hadoop框架会自动顺序迭代解析所有key/value,并将每对key/value交给Mapper或者Reducer处理。表面上看 来,Hadoop限定数据格式必须为key/value形式,过于简单,很难解决复杂问题,实际上,可以通过组合的方法使key或者value(比如在 key或者value中保存多个字段,每个字段用分隔符分开,或者value是个序列化后的对象,在Mapp
您可能关注的文档
最近下载
- D-Z-T 0462.3-2023 矿产资源“三率”指标要求 第3部分:铁、锰、铬、钒、钛(正式版).docx VIP
- 网络系统建设与运维中级 第7章 IPv6协议v3.2.pptx VIP
- 电子科技大学-2018.6月计算复杂性考试.docx VIP
- 吊篮施工计算书.pdf VIP
- 基于PLC的三工位钻床工作台控制系统设计.pptx VIP
- 化工仪表及自动化课件共58张PPT).pptx VIP
- 光固化胶水知识讲座课件.ppt VIP
- EN_IEC_61800-3-2018 可调速电力驱动系统第3部分:EMC要求和具体测试方法.pdf VIP
- 运动性肌肉损伤诊疗专家共识(2026版).docx
- AKH-0.66-200X50II低压电流互感器规格书.pdf VIP
原创力文档

文档评论(0)