3-MapReduce编程.docVIP

  • 29
  • 0
  • 约1.58万字
  • 约 29页
  • 2016-11-23 发布于湖北
  • 举报
MapReduce编程 实验目的 1、理解MapReduce编程模型基本知识 2、掌握MapReduce开发环境的搭建 3、掌握MapReduce基本知识,能够运用MapReduce进行基本的开发 实验原理 MapReduce 是Hadoop两个最基础最重要的成员。是大规模数据(TB 级)计算的利器,Map 和Reduce 是它的主要思想,来源于函数式编程语言Map负责将数据打散,Reduce负责对数据进行聚集,用户只需要实现map 和reduce 两个接口,即可完成TB级数据的计算Hadoop Map Reduce的实现采用了Master/Slave 结构。Master 叫做JobTracker,而Slave 叫做TaskTracker。用户提交的计算叫做Job,每一个Job会被划分成若干个Tasks。JobTracker负责Job 和Tasks 的调度,而TaskTracker负责执行Tasks。常见的应用包括:日志分析和数据挖掘等数据分析应用另外,还可用于科学数据计算,如圆周率PI 的计算等。 MapReduce 框架的核心步骤主要分两部分:Map 和Reduce。当你向MapReduce 框架提交一个计算作业时,它会首先把计算作业拆分成若干个Map 任务,然后分配到不同的节点上去执行,每一个Map 任务处理输入数据中的一部分,当Map 任务完成后,它会生成一些中间文件,

文档评论(0)

1亿VIP精品文档

相关文档