- 3
- 0
- 约2.67千字
- 约 33页
- 2017-07-16 发布于四川
- 举报
Worker故障 Master 周期性的ping每个worker。如果master在一个确定的时间段内没有收到worker返回的信息,那么它将把这个worker标记成失效 重新执行该节点上已经执行或尚未执行的Map任务 重新执行该节点上未完成的Reduce任务,已完成的不再执行 Master故障 定期写入检查点数据 从检查点恢复 WHY? 任务备份机制 慢的workers 会严重地拖延整个执行完成的时间 由于其他的任务占用了资源 磁盘损坏 解决方案: 在临近结束的时候,启动多个进程来执行尚未完成的任务 谁先完成,就算谁 可以十分显著地提高执行效率 本地处理 Master 调度策略: 向GFS询问获得输入文件blocks副本的位置信息 Map tasks 的输入数据通常按 64MB来划分 (GFS block 大小) 按照blocks所在的机器或机器所在机架的范围 进行调度 效果 绝大部分机器从本地读取文件作为输入,节省大量带宽 跳过有问题的记录 一些特定的输入数据常导致Map/Reduce无法运行 最好的解决方法是调试或者修改 不一定可行~ 可能需要第三方库或源码 在每个worker里运行一个信号处理程序,捕获map或reduce任务崩溃时发出的信号,一旦捕获,就会向master报告,同时报告输入记录的编号信息。如果master看到一条记录有两次崩溃信息,那么就会对该记录进
您可能关注的文档
最近下载
- 江苏中考历史历年真题含答案 (32) .pdf VIP
- 2023-2025历年高考英语必备高频词汇800词精选(真题版).docx
- 18医疗器械售后服务管理制度.docx VIP
- 全国青少年机器人技术等级考试(三级)试题.doc VIP
- 10 荀径-列控中心基本原理和功能.ppt
- 湖南省三湘名校教育联盟2024-2025学年高一下学期期中考试 英语试卷含答案.docx VIP
- 2026年江西省景德镇市地理生物会考真题试卷+答案.docx VIP
- 机器人等级考试(三级)模拟题.pdf
- GB 50058-2014 爆炸危险环境电力装置设计规范.docx VIP
- 2026年江西省景德镇市初二地理生物会考考试题库(附含答案).docx VIP
原创力文档

文档评论(0)