MapReduce分布式计算框架.pptx

;;;MapTask作为MapReduce工作流程前半部分,它主要经历5个阶段,分别是Read阶段、Map阶段、Collect阶段、Spill阶段和Combiner阶段。;ReduceTask的工作过程主要经历了5个阶段,分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。;Shuffle是MapReduce的核心,它用来确保每个reducer的输入都是按键排序的。它的性能高低直接决定了整个MapReduce程序的性能高低,map和reduce阶段都涉及到了shuffle机制。;;在当前的开发环境模拟MapReduce执行环境,处理的数据及输出结果在本地操作系统。;;;;;;;;;;;;;;;;

文档评论(0)

1亿VIP精品文档

相关文档