MapRedue作业过程.docVIP

  • 19
  • 0
  • 约7.61千字
  • 约 9页
  • 2016-11-04 发布于重庆
  • 举报
MapRedue作业过程

MapRedue作业. Hadoop 作业构成 .1 Hadoop作业执行流程 用户配置并将一个Hadoop作业提到Hadoop框架中,Hadoop框架会把这个作业分解成一系列map tasks 和reduce tasks。Hadoop框架负责task分发和执行,结果收集和作业进度监控。 下图给出了一个作业从开始执行到结束所经历的阶段和每个阶段被谁控制(用户 or Hadoop框架)。 下图详细给出了用户编写MapRedue作业时需要进行那些工作以及Hadoop框架自动完成的工作: 在编写MapReduce程序时,用户分别通过InputFormat和OutputFormat指定输入和输出格式,并定义Mapper和 Reducer指定map阶段和reduce阶段的要做的工作。在Mapper或者Reducer中,用户只需指定一对key/value的处理逻 辑,Hadoop框架会自动顺序迭代解析所有key/value,并将每对key/value交给Mapper或者Reducer处理。表面上看 来,Hadoop限定数据格式必须为key/value形式,过于简单,很难解决复杂问题,实际上,可以通过组合的方法使key或者value(比如在 key或者value中保存多个字段,每个字段用分隔符分开,或者value是个序列化后的对象,在Mapp

文档评论(0)

1亿VIP精品文档

相关文档