- 1
- 0
- 约1.37万字
- 约 54页
- 2019-04-13 发布于天津
- 举报
程序开发与提交作业基本过程集群分布方式下远程提交作业本地完成程序编写和调试在自己本地安装了单机或伪分布系统的机器上完成程序编写和调试创建用户账户为了能访问集群提交作业需要为每个程序用户创建一个账户获取用户名密码等信息集群分布方式下远程提交作业将数据和程序传送到集群准备好数据和程序目录例如用命令传送至平台主机上在此输入您的密码集群分布方式下远程提交作业用命令远程登录到集群在此输入您的密码将数据复制到中进入到程序包所在目录用命令将数据从文件系统中复制到集群分布方式下远程提交作业用命令向提交计算作业这
程序开发与提交作业基本过程 集群分布方式下远程提交作业 1. 本地完成程序编写和调试 在自己本地安装了单机或伪分布Hadoop系统的机器上,完成程序编写和调试 2.创建用户账户 为了能访问Hadoop集群提交作业,需要为每个程序用户创建一个账户,获取用户名、密码等信息。 集群分布方式下远程提交作业 3.将数据和程序传送到Hadoop集群 准备好数据和程序目录 例如: me@local:~/workspace$ ls -R wordcount wordcount: wordcount.jar wordcount/files: file01.txt file02.txt 用scp命令传送至Hadoop平台主机上: me@local:~/workspace$ scp -r wordcount username@Master :workspace/wordcount username@ Master‘s password: [在此输入您的密码] 集群分布方式下远程提交作业 4.用SSH命令远程登录到Hadoop集群 me@local:~/workspace$ ssh username@Master username@Masters password: [在此输入您的密码] 5.将数据复制到HDFS中 进入到程序包所在目录: username@Master:~$ cd workspace/wordcount username@Master:~/workspace/wordcount$ ls files wordcount.jar ? 用hadoop dfs –put命令将数据从Linux文件系统中复制到HDFS: username@Master:~/workspace/wordcount$ hadoop dfs -put files test-in 集群分布方式下远程提交作业 6.用hadoop jar命令向Hadoop提交计算作业 username@Master:~/workspace/wordcount$ hadoop jar wordcount.jar test-in test-out 这里的test-in为被统计的文本文件的目录,test-out为指定的输出结果的目录,注意test-out目录事先不能存在,若存在需要先删除。 集群分布方式下远程提交作业 7. 查看运行结果 查看test-out目录,统计结果被输出到文件test-out/part-r-00000中 username@Master:~/workspace/wordcount$ hadoop dfs -ls test-out Found 2 items drwxr-xr-x - hadoopusr supergroup 0 2010-05-23 20:29 /user/hadoopusr/test-out/_logs -rw-r--r-- 1 hadoopusr supergroup 35 2010-05-23 20:30 /user/hadoopusr/test-out/part-r-00000 ?查看计算结果 username@Master:~/workspace/wordcount$ hadoop dfs -cat test-out/part-r-00000 GoodBye 1 Hadoop 2 Hello 2 World 1 ? 也可以把文件从HDFS中复制到Linux文件系统中查看 username@Master:~/workspace/wordcount$ hadoop dfs -get test-out/part-r-00000 test-out.txt username@Master:~/workspace/wordcount$ vi test-out.txt GoodBye 1 Hadoop 2 Hello 2 World 1 集群分布方式下远程提交作业 8. 用Hadoop的Web界面查看Hadoop集群和作业状态 在浏览器中打开http:// NameNode节点IP:50070/. 可看到集群的基本信息 集群分布方式下远程提交作业 8. 用Hadoop的Web界面查看Hadoop集群和作业状态 打开页面中的Namenode Logs链
您可能关注的文档
- 2019年促进全开发区改革和创新发展工作要点深入贯彻委十四届.DOC
- 2019年全国男子手球超级精英赛.DOC
- 2019年华南农业大学珠江学院专插本考试人力资源管理概论考试.DOC
- 2019年春季学期2018级草业科学基地课表.DOC
- 2019年深入落实进一步改善医疗服务行动计划重点工作方案为贯彻.DOC
- 2019年辽宁职业院校技能大赛高职组集成电路开发及应用赛项.DOC
- 2019重庆农机校文化广场污水管道招标公告-重庆农机校.DOC
- 2019领导圈定课题招标公告为调动全社科界关注重大现实.DOC
- AP微积分考试5分必会词汇.DOC
- ARM基础知识连载之一转贴.DOC
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
最近下载
- 广州数控GSK980TA1-TA2-TB1-TB2车床数控系统 使用手册.pdf
- 虚实乱针绣入门.ppt VIP
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pdf
- 曲柄连杆机构的运动与受力分析讲解学习.pptx VIP
- 如此伟大的爱G波利切un amore cosi grande G-E-G-F-5P.pdf VIP
- 钛白废酸废水综合治理项目可行性研究报告.docx
- 陕09J02-屋面-标准图集.docx
- 中药当归中阿魏酸的提取工艺研究.pptx
- 蔬菜大棚建设实施方案范文(8篇).docx VIP
- 结合多源异构数据融合技术的人口增长时空预测模型构建及应用分析.pdf VIP
原创力文档

文档评论(0)