- 57
- 0
- 约9.49千字
- 约 7页
- 2021-10-07 发布于辽宁
- 举报
实验3 MapReduce编程初级实践
实验目得
1、 通过实验掌握基本得 MapReduce编程方法;
2、 掌握用MapReduce解决一些常见得数据处理问题,包括数据去重、数据排序与数据挖 掘等。
实验平台
已经配置完成得Had o op伪分布式环境。
实验内容与要求
1、编程实现文件合并与去重操作
对于两个输入文件,即文件A与文件E,请编写Ma pRedu ce程序,对两个文件进行合 并,并剔除其中重复得内容,得到一个新得输出文件 C.下面就是输入文件与输出文件得一个 样例供参考。
实验最终结果(合并得文件):
■ i
J 鼻
如心* o ■
2j *Meiige.jd^ci Ll Iidfi7/luidlhJbL9000/usei/w _ hdf5.//lutd 11 iu5t.9000/u*yX
2O15O1M
y|yX耳1
2O15O1Q4
yyz
^U1 5011X?
X
代码如下:
p ackage 、M e rge ;
im p o r t ja v a、i o、 lOEx c eption ;
imp o rt or g ap a che、 had o op、co nf、 Confi g uration ;
impor t o r g、apache、ha do op、f s、P a th;
impor t o rg、a pache、hado op、i o、Tex t ;
import o r g、a pac h e、hado o p、ma p reduce、Jo b;
imp o rt o rg、apache、hadoop、mapreduce、Mapper;
impo r t o rg、apa c he、h a do o p、m a predu c e、R e d uc e r; imp o rt o rg、a p ache、hadoop m ap re duce、lib、inp ut、; import o r g、ap a che、ha d oop、m apre duc e、li b、outpu t、; public cl ass M erge {
publ i c st atic cl a s s M a p e x ten d s Map pe rO b ject, T e xt, T e x t , Tex t {
pri va t e static Tex t text = n ew Te xt ();
public v o id ma p (O b je ct key , Text va l u e, Conte xt co n t
th r ows 10 E x c eptio n , I nte r r u pted E xcepti on { t ext = value;
c o n t e x t、writ e (text, new T e xt( ” );)
}
}
p u bli c s tatic class R e d uc e e x te n ds ReducerTe x t, Text, Text, Text {
p u blic v o id r e duc e( Text k ey , Iterab 1 e T e x t valu e s,
Con text con text)
thr o ws lOExc e ptio n, Int e rr u p t edE xc e p tion { c on text、wr i te (key, n ew Te x t ( ” );
}
}
p ublic stati c void m ain (String[] ar g s) t hrows Exc e pti o n {
C on f igur a t i on c onf = new Con figur at ion(); conf、s e t (”f s、defaultFS ” , hdfs: //localhost : 900 0 );
S tr i ng [] oth erA rgs = new String □ { input , ” u tput };
i f (otherArgs、len g th ! = 2 ) {
S y s te m、e rr、print 1n (” Usa@ : Me r g e a n d dup 1 ic at e r e mov a l in out );
Sys t em、e x it(2 );
} ”
Job j o b = Job、g etIn s ta
您可能关注的文档
- 实训材料报价单.doc
- 实训项目二回弹法检测砂浆强度实训指导书.doc
- 实践15哲学家进餐问题.doc
- 实践学习科学发展观第一阶段总结.doc
- 实践探究记录单4.doc
- 实践教学体系与内容.doc
- 实践教学活动简报.doc
- 实践科学发展观活动第二阶段工作小结.doc
- 实际光合作用速率与净光合作用速率.doc
- 实验(一)力学部分解析.doc
- 河南推拿职业学院《小型乐队编配》2023-2024学年第一学期期末试卷.doc
- 2025年生物科技五年行业应用趋势行业报告.docx
- 2025-2026学年四川省攀枝花市仁和区六年级数学第一学期期末调研模拟试题含解析.doc
- 2026年种业十年品种改良报告.docx
- 2026年山东省滨州市高职单招职业技能考试题库及答案解析.docx
- 2025年有机茶叶五年分析:深加工技术前景.docx
- 2026年医疗远程手术报告.docx
- 2025至2030中国数字电视发射机行业深度研究及发展前景投资评估分析.docx
- 2025年金属回收行业市场与技术十年报告.docx
- 2026年惠州工程职业学院单招综合素质考试题库及答案解析.docx
原创力文档

文档评论(0)