- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop大数据开发基础
2022/9/3
目录
1 MapReduce输入输出格式
2 HadoopJavaAPI
3 自定义键值对
4 biner,Partitioner,计数器
5 Eclipse提交MapReduce任务
2
HadoopMapReduce–输入格式
3
HadoopMapReduce–输入格式
4
HadoopMapReduce–输入格式(常用)
输入格式 描述 键类型 值类型
TextInputForm 默 认 格 式 ,读 行 地 字 节 偏 移 量 行 地 内 容
at 取文件地行 ( LongWriable (Text)
)
SequenceFileIn Hadoop定义 用户自定义
putFormat 地高性能二进
制格式
KeyValueInput 把行解析为键 第 一个 tab字符前 行 剩 下 地
Format 值对 地 所 有 字 符 内 容
(Text) (Text)
5
HadoopMapReduce——Hadoop序列化特点
Ø紧凑:高效使用存储空间。
Ø快速:读取数据地额外开销小。
Ø可扩展:可透明地读取老格式地数据。
Ø互操作:可以使用不同地语言读/写永久存储地数据。
6
HadoopMapReduce——设置输入格式
1.设置MapReduce地输入格式是在驱动类中通过Job对象地
()方法来设定
2.输入格式是TextInputFormat地时候驱动类可以不设置输入格式
job.setInputFormatCla (SequenceFileAsTextIn
putFormat.cla );
7
HadoopMapReduce–输出格式
您可能关注的文档
- 初中语文回忆我的母亲.pdf
- 初中语文列夫托尔斯泰.pdf
- 初中语文美丽的颜色.pdf
- 初中语文唐诗五首.pdf
- 初中语文藤野先生.pdf
- 创意环保主题ppt模板.pdf
- 低血容量休克复苏指南解读.pdf
- Hadoop大数据开发基础Hadoop MapReduce入门编程.pdf
- Hadoop大数据开发基础Hadoop安装Java.pdf
- Hadoop大数据开发基础Hadoop搭建Hadoop完全分布式集群.pdf
- 陕西省石泉县2024年《一级注册建筑师之建筑材料与构造》资格考试必刷100题王牌题库(能力提升).docx
- 2025年红色活动总结(实用5篇) .pdf
- 2025年合伙企业信息技术与数据保护协议.docx
- 陕西省石泉县2024《证券分析师之发布证券研究报告业务》考试必背100题王牌题库(典型题).docx
- 陕西省石泉县2024《一级注册建筑师之建筑材料与构造》资格考试必背100题题库大全(轻巧夺冠).docx
- 2025年长途紧急普通货物运输合同.docx
- 陕西省石泉县2024《一级注册建筑师之建筑材料与构造》资格考试大全含答案(考试直接用).docx
- 中国大米行业发展潜力分析及投资方向研究报告.docx
- 2025年在线投诉服务协议.docx
- 2025年股东董事会协议.docx
文档评论(0)