- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学习hadoop第二步MapReduce任务的基础知识
2 MapReduce任务的基础知识2.1 Hadoop MapReduce作业的基本构成要素12.1.1 输入分割块52.1.2 一个简单的Map任务:IdentityMapper52.2 配置作业102.2.1 指定输入格式222.2.2 设置输出参数242.2.3 配置Reduce阶段302.3 执行作业322.4 创建客户化的Mapper和Reducer35这一章,我们将整体的介绍MapReduce作业。读完本章,你能编写和执行单机模式的MapReduce作业程序。本章中的样例程序假设你已经完成了第一章的设置。你可以在一个专用的本地模式配置下,使用一台单机执行这些样例程序,你不需要启动Hadoop核心框架。对于调试和单元测试,单机模式配置是最理想的。你能够从Apress网站()上这本书所在的页面下载这些样例代码。这些可下载的代码也包含一个用来执行样例程序的JAR文件。下面我们就开始查看MapReduce作业的必要组成要素。2.1 Hadoop MapReduce作业的基本构成要素用户可以配置和向框架提交MapReduce任务(简言之,作业)。一个MapReduce作业包括Map任务,混淆过程,排序过程和一套Reduce任务。然后框架会管理作业的分配和执行,收集输出和向用户传递作业结果。用户负责处理作业初始化,指定输入位置,指定输入和确保输入格式和位置是正确无误的。框架负责在集群中TaskTracker节点上派遣作业,执行map过程,混淆过程,排序过程和Reduce过程,把输出写入输出目录,最后通知用户作业完成状态。本章的所有样例程序都基于文件MapReduceIntro.java,如列表2-1 所示。文件MapReduceIntro.java的代码所创建的作业逐行的读取输入,然后,根据每一行第一个Tab字符前面的部分排序这些行,如果某一行没有Tab 字符,框架会根据整个行进行排序。MapReduceIntro.java文件是一个简单的实现了配置和执行MapReduce作业的样例程序。 列表2-1 MapReduceIntro.javapackagecom.apress.hadoopbook.examples.ch2; importjava.io.IOException; importorg.apache.hadoop.io.Text; importorg.apache.hadoop.mapred.FileInputFormat; importorg.apache.hadoop.mapred.FileOutputFormat; importorg.apache.hadoop.mapred.JobClient; importorg.apache.hadoop.mapred.JobConf; importorg.apache.hadoop.mapred.KeyValueTextInputFormat; importorg.apache.hadoop.mapred.RunningJob; importorg.apache.hadoop.mapred.lib.IdentityMapper; importorg.apache.hadoop.mapred.lib.IdentityReducer; importorg.apache.log4j.Logger; /*** A very simple MapReduce example that reads textual input where each record is* a single line, and sorts all of the input lines into a single output file.* * The records are parsed into Key and Value using the first TAB character as a* separator. If there is no TAB character the entire line is the Key. ** * @authorJason Venner* */public classMapReduceIntro { protectedstaticLoggerlogger=Logger.getLogger(MapReduceIntro.class); /*** Configure and run the MapReduceIntro job.* * @paramargs* Not used.*/public static voidmain(finalString[] args) { try{/*** Construct the job conf object that will
您可能关注的文档
最近下载
- 新股骨颈骨折病人的护理ppt课件.ppt
- 2023年10月29日四川省事业单位联考《综合知识》试题及答案解析.pdf VIP
- 2025至2030全球及中国门窗制造商行业项目调研及市场前景预测评估报告.docx
- 风电项目考察报告编制模板.docx VIP
- 肝癌患者生命质量测定量表.pdf VIP
- 发那科Line tracking-追踪说明.pdf VIP
- 2025至2030玻璃行业项目调研及市场前景预测评估报告.docx VIP
- 5.2《大学之道》课件(共39张PPT) 2025-2026学年统编版高中语文选择性必修上册.pptx VIP
- 椭圆标准方程导学案.doc VIP
- 单片机烟雾检测报警系统设计方案.docx VIP
原创力文档


文档评论(0)