- 5
- 0
- 约8.19千字
- 约 10页
- 2018-06-08 发布于江西
- 举报
Hadoop学习总结之三:Map-Reduce入门.doc
1、Map-Reduce的逻辑过程
假设我们需要处理一批有关天气的数据,其格式如下:
按照ASCII码存储,每行一条记录
每一行字符从0开始计数,第15个到第18个字符为年
第25个到第29个字符为温度,其中第25位是符号+/-
0067011990999991950051507+0000+
0043011990999991950051512+0022+
0043011990999991950051518-0011+
0043012650999991949032412+0111+
0043012650999991949032418+0078+
0067011990999991937051507+0001+
0043011990999991937051512-0002+
0043011990999991945051518+0001+
0043012650999991945032412+0002+
0043012650999991945032418+0078+ 现在需要统计出每年的最高温度。
Map-Reduce主要包括两个步骤:Map和Reduce
每一步都有key-value对作为输入和输出:
map阶段的key-value对的格式是由输入的格式所决定的,如果是默认的TextInputFormat,则每行作为一个记录进程处理,其中key为此行的开头相对于文件的起始位置,val
您可能关注的文档
- 人力资源管理师考试培训教程-第讲 第六章:劳动关系管理(六).doc
- 学科教学(语文)考研准备之鲁迅.doc
- 基于JEE Struts框架的课程设计实训项目——《BBS论坛系统》——针对项目中系统管理员信息的数据访问组件及单元测试(第部分).doc
- 制度建设:保障和促进社会公平正义的关键.doc
- 在公司质量、环境、职业健康安全管理体系文件发布会上的发言稿(新).doc
- 新版印花税申报表下载 新版印花税.doc
- 2016中国旅游网络关注度年度报告.doc
- 齐眉棍(Qimei gun).doc
- IBM分销渠道设计 字 投稿:孔孧孨.doc
- 2009最版新GHOST系统封装 全图 教程 工具 官方认证 500.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 草船借箭-完整版课件.ppt VIP
- 江苏省南京市盐城市2021届高三3月第二次模拟考试化学试题(word含答案 ).docx VIP
- 草船借箭-PPT完整版.pptx VIP
- 2025年上海市安全员(C3证)考试练习题库(含答案).docx VIP
- 小学英语新人教版PEP三年级上册Unit 1 Making friends Part A第1课时教学课件(2024秋).pptx VIP
- 2026年卫滨区十五五规划.docx
- (最新)25年春统编一年级语文下册动物王国开大会【精品课件】.pptx VIP
- 红旗区十五五规划初稿.docx
- 生物化学中英文对照习题.pdf VIP
- 【西门子】SINAMICS G120X 变频器 操作说明.pdf VIP
原创力文档

文档评论(0)