Hadoop编程入门-MapReduce程序设计.pptxVIP

  • 2
  • 0
  • 约小于1千字
  • 约 21页
  • 2019-12-02 发布于湖北
  • 举报
MapReduce程序设计;WordCount详解;Linux Shell;Mapreduce;如何对付大数据处理:分而治之;构建抽象模型:Map与Reduce;上升到构架: 自动并行化并隐藏底层细节;上升到构架: 自动并行化并隐藏底层细节;Hadoop的主要处理引擎是Mapreduce(map和reduce的组合)。 解决实际问题: 日志分析 数据排序 文本处理 基于模式的搜索 图像处理 机器学习 ……;假设我们需要处理一批有关天气的数据,其格式如下: 按照ASCII码存储,每行一条记录 每一行字符从0开始计数,第15个到第18个字符为年 第25个到第29个字符为温度,其中第25位是符号+/-;Map-Reduce数据流;Map-Reduce数据流;WordCount详解;WordCount详解;Main函数分析;JobConf;Map函数分析;Reduce函数分析;MapReduce设计模式;Spark;相关练习

文档评论(0)

1亿VIP精品文档

相关文档