? Cloudera提供给客户的服务内容之一就是调整和优化MapReduce job执行性能。MapReduce和HDFS组成一个复杂的分布式系统,并且它们运行着各式各样用户的代码,这样导致没有一个快速有效的规则来实现优化代码性能的目的。在我看来,调整cluster或job的运行更像一个医生对待病人一样,找出关键的“症状”,对于不同的症状有不同的诊断和处理方式。???????? 在医学领域,没有什么可以代替一位经验丰富的医生;在复杂的分布式系统上,这个道理依然正确—有经验的用户和操作者在面对很多常见问题上都会有“第六感”。我曾经为Cloudera不同行业的客户解决过问题,他们面对的工作量、数据集和cluster硬件有很大区别,因此我在这方面积累了很多的经验,并且想把这些经验分享给诸位。???????? 在这篇blog里,我会高亮那些提高MapReduce性能的建议。前面的一些建议是面向整个cluster的,这可能会对cluster 操作者和开发者有帮助。后面一部分建议是为那些用Java编写MapReduce job的开发者而提出。在每一个建议中,我列出一些“症状”或是“诊断测试”来说明一些针对这些问题的改进措施,可能会对你有所帮助。???????? 请注意,这些建议中包含很多我以往从各种不同场景下总结出来的直观经验。它们可能不太适用于你所面对的特殊的工作量、数据集或cl
您可能关注的文档
- LTPS工艺流程与技术程序.ppt
- Luckyclover精油篇程序.ppt
- LW35-72.5断路器安装使用说明书程序.doc
- lz3-1DNA是主要的遗传物质程序.ppt
- lz3-2DNA分子的结构程序.ppt
- FrankLloydWright程序.ppt
- l兰大胃癌教学程序.ppt
- M《桥边的老人》程序.ppt
- M01建立数学模型xfc程序.ppt
- ftp实现用户隔离和权限划分程序.doc
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
最近下载
- 基于MATLAB的电力系统单相短路故障仿真分析.docx VIP
- ST-ZLJL-507-04硫化橡胶撕裂强度测定不确定度的评定报告.doc VIP
- 金蝶云·星辰操作手册.pdf VIP
- 《科学思维和科学研究方法》-潘雁钦教学大纲.pdf
- 韭菜的自我修养核心精华.pdf VIP
- 23331-2020能源管理体系 全条款内部审核检查记录表.pdf VIP
- 2025年幼儿园晨午检记录管理制度.docx VIP
- BYD比亚迪汽车BYD ATTO 3 brochure说明书用户手册.pdf
- 知识产权宣传普法课件.pptx VIP
- 第一单元 珍惜青春时光(期末复习教学设计)七年级道德与法治下册(统编版2024).docx VIP
原创力文档

文档评论(0)