- 7
- 0
- 约7.61万字
- 约 58页
- 2017-09-11 发布于浙江
- 举报
目录目录?I
初识Hadoop?1
1.1? 数据!数据?1
1.2? 数据的存储和分析?3
1.3? 相较于其他系统?4
1.4? Hadoop发展简史?9
1.5? Apache Hadoop项目?12
MapReduce简介?15
2.1? 一个气象数据集?15
2.2? 使用Unix Tools来分析数据?17
2.3? 使用Hadoop进行数据分析?19
2.4? 分布化?30
2.5? Hadoop流?35
2.6? Hadoop管道?40
Hadoop分布式文件系统?44
3.1? HDFS的设计?44
3.2? HDFS的概念?45
3.3? 命令行接口?48
3.4? Hadoop文件系统?50
3.5? Java接口?54
3.6? 数据流?68
3.7? 通过distcp进行并行复制?75
3.? Hadoop归档文件?77
Hadoop的I/O?80
4.1? 数据完整性?80
4.2? 压缩?83
4.3? 序列化?92
4.4? 基于文件的数据结构?111
MapReduce应用开发?125
5.1? API的配置?126
5.2? 配置开发环境?128
5.3? 编写单元测试?134
5.4? 本地运行测试数据?138
5.5? 在集群上运行?144
5.6? 作业调优?159
5.7? MapReduce的工作流?162
MapReduce的工作原理
您可能关注的文档
最近下载
- 2025年新《城市轨道交通概论》考试题库及答案.docx VIP
- [运维]-办公设备维护方案.docx VIP
- 小儿疾病推拿技术规范.pptx VIP
- 地籍测绘成果检查验收细则.docx VIP
- 2026年广中医研究生复试题库附答案.docx VIP
- 10J121 外墙外保温建筑构造.docx VIP
- 经常性思想工作实施细则.pdf VIP
- 计算机体系结构课后习题原版答案_张晨曦著.doc VIP
- 开学第一课:一颗荔枝里的中国地理密码 高中地理人教版必修一.pptx VIP
- Unit4 第4课时(大单元教学课件) Sound timeCheckout timeTicking time 五年级英语下册译林三起.pptx VIP
原创力文档

文档评论(0)