- 20
- 0
- 约5.18千字
- 约 32页
- 2017-08-27 发布于河南
- 举报
MapReduce是 Hadoop程序的体现。框架极其简单:首先是对MapReduce程序运行前的参数配置,然后编写Map类(实现Map方法),最后是Reduce类(实现Reduce方法)。 MapReduce程序的每个细节都与设置的参数有很大的关系,参数设置的好,程序的效率肯定得到提高。 Map方法:Map(k1,v1)?-list(k2,v2) ,并行应用于每一个输入的数据集,每一次调用都会产生一个(k2,v2)的队列 。 Reduce方法:Reduce(k2,list(v2))?-?list(k3,v3)。收集map端输出队列list(k2,v2)中有相同key的数据对,把它们聚集在一起,输出时形成目的数据?list(k3,v3)。 优化内容 最佳实践 mapper的数量 运行mapper需要多长时间? reducer的数量 为了达到最高性能,reducer的数目应该比reducer槽(由内存和tasktracker槽决定)的数目稍微少一点,这将reducer使reducer能够在同一波中完成任务。 combiner 作业能否充分利用combiner来减少通过shuffle传输的数据 中间值的产生 对map输出进行压缩能使作业执行更快 自定义序列 如果正在使用自定义的writable对象或自定义的comparator,则必须确保已实现RawComparator shuffle
您可能关注的文档
- 通信工程实施业务流程.ppt
- 通信用铁锂电池系统——3G时代后备电源最佳解决方案.pdf
- 通信与广电工程技巧课件(有线部分)2[教学].ppt
- 投标申请书.doc
- 网吧组网实例.pdf
- 网络游戏美女营销拐你进去玩的各种手法大揭秘.doc
- 网上金融与电子支付系统.doc
- 网优经验集-GSM测试工具(TEMS)使用.doc
- 微计算机原理与接口技术.ppt
- 维修手册_赛欧.pdf
- 2026四川凉山州西昌市住房和城乡建设局招聘工作人员2名考试备考试题及答案解析.docx
- 2026年福建龙岩市新罗区事业单位招聘58人考试参考试题及答案解析.docx
- 2026广西崇左天等县人民武装部编外聘用人员招聘2人考试参考题库及答案解析.docx
- 2026山东滨州市沾化区部分区直学校校园招聘7人(山师-曲师站)考试参考题库及答案解析.docx
- 2026广东东莞市常平镇编外聘用人员招聘5人考试参考题库及答案解析.docx
- 2026年河北邯郸魏县公开招聘社区工作者120名考试参考题库及答案解析.docx
- 2026福建三明港务地产有限公司社会招聘1人考试备考试题及答案解析.docx
- 2026湖南永州市江永县兴园再生资源有限公司公司招聘6人考试备考题库及答案解析.docx
- 2026广东云浮市新兴县招聘机关事业单位紧缺人才4人(华南师范大学专场)考试备考试题及答案解析.docx
- 2026广东深圳小学光明学校(集团)招聘优秀教师19人考试备考试题及答案解析.docx
最近下载
- 检验科程序性文件.doc VIP
- 2026上海新高考英语七选五专项训练试卷(附答案解析).docx VIP
- 2026届高三语文一轮复习:赏析小说情节课件(共51张PPT).pptx
- 中国脑卒中康复治疗指南_2011完全版_.pdf VIP
- 幼儿园大班数学活动《水果喜乐会——按规律排序》公开课教学课件.ppt VIP
- 广东省建筑与装饰工程综合定额章节说明及计算规则.pdf VIP
- AP物理2 最新版官方样题 选择题+问答题+公式汇总 (含答案) AP Physics 2 Formulas MCQ + FRQ Sample Questions.pdf VIP
- 2026安徽新高考英语七选五专项训练试卷(附答案解析).docx VIP
- 高速公路施工现场安全防护标准化图集.pdf VIP
- 函数的极限(左右极限)精编版.ppt VIP
原创力文档

文档评论(0)