- 8
- 0
- 约2.65千字
- 约 33页
- 2016-09-22 发布于贵州
- 举报
googl云计算原理之并行数据处理模型mapreduce
Worker故障 Master 周期性的ping每个worker。如果master在一个确定的时间段内没有收到worker返回的信息,那么它将把这个worker标记成失效 重新执行该节点上已经执行或尚未执行的Map任务 重新执行该节点上未完成的Reduce任务,已完成的不再执行 Master故障 定期写入检查点数据 从检查点恢复 WHY? 任务备份机制 慢的workers 会严重地拖延整个执行完成的时间 由于其他的任务占用了资源 磁盘损坏 解决方案: 在临近结束的时候,启动多个进程来执行尚未完成的任务 谁先完成,就算谁 可以十分显著地提高执行效率 本地处理 Master 调度策略: 向GFS询问获得输入文件blocks副本的位置信息 Map tasks 的输入数据通常按 64MB来划分 (GFS block 大小) 按照blocks所在的机器或机器所在机架的范围 进行调度 效果 绝大部分机器从本地读取文件作为输入,节省大量带宽 跳过有问题的记录 一些特定的输入数据常导致Map/Reduce无法运行 最好的解决方法是调试或者修改 不一定可行~ 可能需要第三方库或源码 在每个worker里运行一个信号处理程序,捕获map或reduce任务崩溃时发出的信号,一旦捕获,就会向master报告,同时报告输入记录的编号信息。如果master看到一条记录有两次崩溃信息,那么就会对该记录进
您可能关注的文档
最近下载
- 重大件设备海运加速度计算方法分析.pdf VIP
- 2026年伤寒论 期末试题及答案.doc VIP
- 安徽海绵城市建设技术-雨水控制与利用工程.pdf VIP
- AQ3067-2026《化工和危险化学品生产经营企业重大生产安全事故隐患判定准则》宣贯培训课件.pptx
- Braden压疮风险评估表.docx VIP
- 2022年黑龙江哈尔滨“丁香人才周”(秋季)事业单位引才招聘考试真题.docx VIP
- 河流底栖动物BMWP指数科级敏感值、耐污值、着生硅藻指示值和敏感值列表、IBI指数构建流程.pdf VIP
- 富士达电梯PMC使用说明.pdf VIP
- TB 10314-2021 邻近铁路营业线施工安全监测技术规程.pdf VIP
- 螺栓拧紧力矩标准全之欧阳家百创编.pdf
原创力文档

文档评论(0)