05单元五 大数据的离线处理MapReduce.pptx

单元五大数据的离线处理MapReduce;?掌握Map和Reduce阶段的作用和创建

?掌握MapReduceJava开发项目的搭建

?熟悉HadoopWritable中的各种数据类型

?熟悉MapReduce开发环境安装配置

?熟悉Shuffle、Partition、Combiner等组件的作用

?理解实时处理与离线处理;5.1离线处理技术MapReduce ;MR在进行数据处理时,会将运算任务视为一个job(作业),job的生命周期从任务提交开始,到任务完成,退出MR时结束。因此,如果有新的数据需要处理时,必须重新提交。这种任务模型只适合于对时效要求不高的离线型运算任务。

文档评论(0)

1亿VIP精品文档

相关文档