大数据培训难?Hadoop MapReduce原理讲解.pdfVIP

  • 3
  • 0
  • 约2.63千字
  • 约 7页
  • 2017-07-01 发布于天津
  • 举报

大数据培训难?Hadoop MapReduce原理讲解.pdf

大数据培训难?Hadoop MapReduce原理讲解.pdf

中国IT职业教育领先品牌 精品课程 全程面授 大数据培训难?Hadoop MapReduce 原理讲解 MapReduce 是一种编程模型,用于大规模数据集的分布式运算。 1、MapReduce 通俗解释 图书馆要清点图书数量,有10 个书架,管理员为了加快统计速度,找来了10 个同学,每个同学负责统计一个书架的图书数量。 张同学统计 书架1 王同学统计 书架2 刘同学统计 书架3 …… 过了一会儿,10 个同学陆续到管理员这汇报自己的统计数字,管理员把各个数 字加起来,就得到了图书总数。 这个过程就可以理解为MapReduce 的工作过程。 2、MapReduce 中有两个核心操作 (1)map 管理员分配哪个同学统计哪个书架,每个同学都进行相同的“统计”操作,这个过 程就是map。 (2)reduce 每个同学的结果进行汇总,这个过程是reduce。 3、MapReduce 工作过程拆解 下面通过一个景点案例 (单词统计)看MapReduce 是如何工作的。 有一个文本文件,被分成了4 份,分别放到了4 台服务器中

文档评论(0)

1亿VIP精品文档

相关文档