- 2
- 0
- 约2.05千字
- 约 7页
- 2026-06-21 发布于北京
- 举报
1.需求:
统计每一个号耗费的总上行流量、下行流量、总流量
2.数据准备:
(1)输入数据格式:
时间戳、、的地址、的ip、、数
据包、接包数、上行/传流量、下行/载流量、响应码
(2)最终输出的数据格式:
上行流量下行流量总流量
3.基本思路:
(1)Map阶段:
(a)一行数据,切分字段
(b)抽取号、上行流量、下行流量
(c)以号为key,bean对象为value输出,即context.write(手
机号,bean);
(2)Reduce阶段:
(a)累加上行流量和下行流量得到总流量。
(b)实现自定义的bean来封装流量信息,并将bean作为map输出
的key来传输
(c)MR程序在处理数据的过程中会对数据排序(map输出的kv对传
输到reduce之前,会排序),排序的依据是map输出的key
所以,我们如果要实现自己需要的排序规则,则可以考虑将排序因素
放到key中,让key实现接口:WritableComparable。
然后重
您可能关注的文档
最近下载
- 中国机器人手术麻醉管理专家共识(2026).docx VIP
- 抗菌药物的合理使用PPT课件.ppt VIP
- 电力工程人工挖孔桩施工方案(掏挖基础施工方案)(1).pdf VIP
- 低代码知识理论练习试题及答案.doc VIP
- 森林防火常识试题及答案.docx VIP
- 2024-2025学年天津市河北区八年级下学期期末数学试卷[附答案].pdf VIP
- 职业卫生技术服务管理体系文件【程序文件】.docx VIP
- 施工生产安全事故应急救援预案(通用5篇).docx VIP
- 二年级下册语文期末专项复习.pdf VIP
- 2016年福建省职业院校技能大赛高职组中餐主题宴会设计插花提供的物品明细.doc VIP
原创力文档

文档评论(0)