- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hadoop-map-reduce执行流程调研报告
hadoop-map-reduce执行流程调研报告参与者:Client 简称:CJobTracker 简称:JTTaskTracker 简称:TTDataNode 简称:DNNameNode 简称:NN流程描述:简述:作业的提交 - Map任务的分配和执行 - Reduce任务的分配和执行 - 作业的完成每个具体的任务又分: 准备输入- 算法的执行 - 输出结果,三个步骤.作业的提交: 1. /home/hadoop/hadoop-1.0.3/bin/hadoo jar ~/learning-hadoop.jar com.easou.mr.bookMark.BookMarkMR 2. RunJar.java - main 3.反射 -BookMarkMR-main 4. org.apache.hadoop.mapreduce.Job -waitForCompletion//提交i f (state == JobState.DEFINE) {submit();} 5. org.apache.hadoop.mapred.JobClient - submitJobInternal 6./data/tmp/core/mapred/staging/hadoop/.staging/jobid/job.jar(执行jar)/data/tmp/core/mapred/staging/hadoop/.staging/jobid/job.split(输入分片文件)/data/tmp/core/mapred/staging/hadoop/.staging/jobid/job.splitmetainfo(分片meta)/data/tmp/core/mapred/staging/hadoop/.staging/jobid/job.xml(jobconf配置信息)7.this.jobSubmitClient = createRPCProxy(JobTracker.getAddress(conf), conf);JobID jobId = jobSubmitClient.getNewJobId();//jobid的生成方式public JobStatus submitJob(JobID jobId, String jobSubmitDir, Credentials ts) throws IOExceptionsynchronized (jobs) { synchronized (taskScheduler) { jobs.put(job.getProfile().getJobID(), job); for (JobInProgressListener listener : jobInProgressListeners) { listener.jobAdded(job); } } }Map reduce任务的分配和执行:C rpc 调用 addJob 触发监听: JobQueueJobInProgressListener(用于监控job的运行状态) EagerTaskInitializationListener;(用于对Job进行初始化)public void run() { JobInProgress job = null; while (true) { try { synchronized (jobInitQueue) { while (jobInitQueue.isEmpty()) { jobInitQueue.wait(); } job = jobInitQueue.remove(0); } threadPool.execute(new InitJob(job)); } catch (InterruptedException t) { LOG.info(JobInitManagerThread interrupted.); break; } } LOG.info(Shutting down thread pool); threadPool.shutdownNow();} //后台守护运行jobInitManagerThread.setDaemon(true); this.jobInitManagerThread.start();死循环等待job加入,并初始化.JT初始化task JobInProgress - initTasks 1.从HDFS中读取job.split文件从而生成input splits2.map task的个数就是input split的个数 numMapTasks = splits.length;3.为每个map tasks生成一个TaskInProgress来处理一个input split4.对于map
您可能关注的文档
最近下载
- 2024-2030年中国六氟磷酸锂行业市场现状供需分析及投资评估规划分析研究报告.docx
- 防护工程之三维网植被护坡(附施工图解、工艺、造价编制).pdf VIP
- 《中铁一局集团有限公司工程项目管理绩效考核办法》(中铁一成本[2015]623号).doc
- 机械打眼开炸石方(附施工图解、造价编制).pdf VIP
- 路基土石方(借土填方)(附施工图解、工艺、造价编制).pdf VIP
- 2023扬州龙川控股集团有限责任公司招聘试题及答案解析.docx
- 交通安全设施之交通标志(附施工图解、工艺、造价编制).pdf VIP
- 路基土石方之填挖交界(附施工图解、工艺、造价编制).pdf VIP
- 2纵横造价实战--抛石挤淤附施工图解、工艺、造价编制.pdf
- 2024《我的阿勒泰》作品简介PPT课件(精品).pptx
文档评论(0)