- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Hadoop大数据项目开发——单词统计功能代码-Redcuer实现
目录content02Reducer阶段代码编写01Mapper阶段代码编写03Drive阶段代码编写
Reducer阶段代码importjava.io.IOException;importjava.util.Iterator;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Reducer;publicclassWordcountReducerextendsReducerText,IntWritable,Text,IntWritable{ @Override protectedvoidreduce(Textkey,IterableIntWritablevalues, Contextcontext)throwsIOException,InterruptedException{ intcount=0; IteratorIntWritableiterator=values.iterator(); while(iterator.hasNext()){ IntWritablevalue=iterator.next(); count+=value.get();//对相同键值的单词键值进行累加 } context.write(key,newIntWritable(count)); }}
继承Reducer类代码中使用extends关键字继承ReducerKEYIN,VALUEIN,KEYOUT,VALUEOUT类。此时Mapper的输出,经过Shuffle过程,成为Reducer的输入,所以ReducerKEYIN,VALUEIN,KEYOUT,VALUEOUT数据类型与Mapper输出的数据类型一致,即ReducerText,IntWritable,Text,IntWritable,输入Reducer后会自动补全。
重写reduce方法
重写reduce方法删除此行
重写reduce方法reduce()方法编写逻辑代码:intcount=0;IteratorIntWritableiterator=values.iterator();while(iterator.hasNext()){//判断是否还有元素 IntWritablevalue=iterator.next();//获取下一个元素 count+=value.get();//对相同键值的单词键值进行累加}context.write(key,newIntWritable(count));
您可能关注的文档
- 1.1走进大数据世界(完).pptx
- 3.2CentOS 7操作系统安装.pptx
- 3.4虚拟机集群环境配置-修改IP地址.pptx
- 3.5虚拟机集群环境配置 -修改主机名和配置主机IP映射.pptx
- 3.6虚拟机集群环境配置 - 免密登录.pptx
- 3.8 Hadoop分布式集群搭建.pptx
- Hadoop大数据开发基础与案例实战(微课版)课件 3.3虚拟机克隆.pptx
- Hadoop大数据开发基础与案例实战(微课版)课件 3.1虚拟机安装.pptx
- Hadoop大数据开发基础与案例实战(微课版)课件 2.1Hadoop简介.pptx
- Hadoop大数据开发基础与案例实战(微课版)课件 2.2Hadoop生态系统(完).pptx
文档评论(0)