Hadoop权威指南---中文版.docVIP

  • 7
  • 0
  • 约7.6万字
  • 约 76页
  • 2017-02-12 发布于浙江
  • 举报
Hadoop权威指南---中文版.doc

目录目录?I 初识Hadoop?1 1.1? 数据!数据?1 1.2? 数据的存储和分析?3 1.3? 相较于其他系统?4 1.4? Hadoop发展简史?9 1.5? Apache Hadoop项目?12 MapReduce简介?15 2.1? 一个气象数据集?15 2.2? 使用Unix Tools来分析数据?17 2.3? 使用Hadoop进行数据分析?19 2.4? 分布化?30 2.5? Hadoop流?35 2.6? Hadoop管道?40 Hadoop分布式文件系统?44 3.1? HDFS的设计?44 3.2? HDFS的概念?45 3.3? 命令行接口?48 3.4? Hadoop文件系统?50 3.5? Java接口?54 3.6? 数据流?68 3.7? 通过distcp进行并行复制?75 3.? Hadoop归档文件?77 Hadoop的I/O?80 4.1? 数据完整性?80 4.2? 压缩?83 4.3? 序列化?92 4.4? 基于文件的数据结构?111 MapReduce应用开发?125 5.1? API的配置?126 5.2? 配置开发环境?128 5.3? 编写单元测试?134 5.4? 本地运行测试数据?138 5.5? 在集群上运行?144 5.6? 作业调优?159 5.7? MapReduce的工作流?162 MapReduce的工作原理

文档评论(0)

1亿VIP精品文档

相关文档