MapReduce是 Hadoop程序的体现。框架极其简单:首先是对MapReduce程序运行前的参数配置,然后编写Map类(实现Map方法),最后是Reduce类(实现Reduce方法)。 MapReduce程序的每个细节都与设置的参数有很大的关系,参数设置的好,程序的效率肯定得到提高。 Map方法:Map(k1,v1)?-list(k2,v2) ,并行应用于每一个输入的数据集,每一次调用都会产生一个(k2,v2)的队列 。 Reduce方法:Reduce(k2,list(v2))?-?list(k3,v3)。收集map端输出队列list(k2,v2)中有相同key的数据对,把它们聚集在一起,输出时形成目的数据?list(k3,v3)。 优化内容 最佳实践 mapper的数量 运行mapper需要多长时间? reducer的数量 为了达到最高性能,reducer的数目应该比reducer槽(由内存和tasktracker槽决定)的数目稍微少一点,这将reducer使reducer能够在同一波中完成任务。 combiner 作业能否充分利用combiner来减少通过shuffle传输的数据 中间值的产生 对map输出进行压缩能使作业执行更快 自定义序列 如果正在使用自定义的writable对象或自定义的comparator,则必须确保已实现RawComparator shuffle
您可能关注的文档
- 12创建三维实体和曲面教程.ppt
- 2014年建筑工地安全生产培训图片三教程.ppt
- 12第12章城乡住区规划教程.ppt
- 2014年建筑业发展统计教程.doc
- 12第12章贸易条约和协定与世界贸易组织教程.ppt
- 2014年江苏公务员行测真题完整版(A卷)教程.doc
- 12第12章投资教程.ppt
- 2014年江苏省公务员考试公共基础教程.doc
- 12第二章儿童心理发展1教程.ppt
- 2014年教育学教程.ppt
- 2026年中考地理一轮复习知识清单专题11 中国的自然灾害与环境保护(知识清单)(原卷版).pdf
- 2026年中考地理一轮复习知识清单专题11 中国的自然灾害与环境保护(知识清单)(解析版).docx
- 2026年中考地理一轮复习知识清单专题13 中国的经济发展(知识清单)(解析版).pdf
- 2026年中考地理一轮复习知识清单专题13 中国的经济发展(知识清单)(原卷版).docx
- 2026年中考地理一轮复习知识清单专题13 中国的经济发展(知识清单)(原卷版).pdf
- 2026年中考地理一轮复习知识清单专题11 中国的自然灾害与环境保护(知识清单)(解析版).pdf
- 杂志风成都印象旅游宣传画册PPT作品范本23页PPT.pptx
- 城市介绍PPT杭州.pptx
- 第一章 第5讲 氧化还原反应方程式的配平及计算(教师版).pdf
- 高三化学一轮复习 专题集训10 铝及其化合物(两性金属).pdf
最近下载
- 急危重症患者院内转送制度.docx VIP
- 《自动控制原理》胡寿松(第6版)课后习题答案.docx VIP
- 双动拉深压力机.ppt VIP
- JGJT 67-2019- 办公建筑设计标准.pdf VIP
- 《商业银行综合柜台业务》课件——项目二:日初日终业务处理——柜面运营流程.pptx VIP
- 《商业银行综合柜台业务》课件——项目六:银行卡与电子银行业务——零售业务数字化.pptx VIP
- TB∕T 1528.1-2018 铁路信号电源系统设备 第1部分:通用要求.pdf VIP
- 2025年6月福建省高中学业水平合格性考试(会考)生物试题(含答案解析).docx VIP
- 团员证明(模板).doc VIP
- 王安石《梅花》PPT课件.pptx VIP
原创力文档

文档评论(0)