通用计算机大数据存储及分析处理平台Hadoop.docx

通用计算机大数据存储及分析处理平台Hadoop.docx

PAGE \* MERGEFORMATV 通用大数据存储与分析处理平台 总体建设方案 (Hadoop) 目 录 TOC \o 2-3 \h \z \t 标题 1,1 HYPERLINK \l _Toc392013741 1 Hadoop PAGEREF _Toc392013741 \h 1 HYPERLINK \l _Toc392013742 1.1 概述 PAGEREF _Toc392013742 \h 1 HYPERLINK \l _Toc392013743 1.1.1 Hadoop能做什么 PAGEREF _Toc392013743 \h 1 HYPERLINK \l _Toc392013744 1.2 特点 PAGEREF _Toc392013744 \h 1 HYPERLINK \l _Toc392013745 1.3 软件设计 PAGEREF _Toc392013745 \h 1 HYPERLINK \l _Toc392013746 1.3.1 Hadoop 中的文件格式 PAGEREF _Toc392013746 \h 1 HYPERLINK \l _Toc392013747 1.3.2 机架感知 PAGEREF _Toc392013747 \h 10 HYPERLINK \l _Toc392013748 1.4 Hadoop知识学习篇 PAGEREF _Toc392013748 \h 11 HYPERLINK \l _Toc392013749 1.4.1 RPC PAGEREF _Toc392013749 \h 11 HYPERLINK \l _Toc392013750 1.4.2 Avro、Thrift PAGEREF _Toc392013750 \h 11 HYPERLINK \l _Toc392013751 1.4.3 Java接口 PAGEREF _Toc392013751 \h 11 HYPERLINK \l _Toc392013752 1.4.4 FileSystem总结 PAGEREF _Toc392013752 \h 1 HYPERLINK \l _Toc392013753 1.4.5 文件读取过程/文件写入过程 PAGEREF _Toc392013753 \h 4 HYPERLINK \l _Toc392013754 1.4.6 Hadoop均衡器 PAGEREF _Toc392013754 \h 1 HYPERLINK \l _Toc392013755 1.4.7 Hadoop存档 PAGEREF _Toc392013755 \h 1 HYPERLINK \l _Toc392013756 1.4.8 数据完整性 PAGEREF _Toc392013756 \h 3 HYPERLINK \l _Toc392013757 1.4.9 压缩 PAGEREF _Toc392013757 \h 4 HYPERLINK \l _Toc392013758 1.4.10 序列化【优点】 PAGEREF _Toc392013758 \h 6 HYPERLINK \l _Toc392013759 1.4.11 序列化框架 PAGEREF _Toc392013759 \h 11 HYPERLINK \l _Toc392013760 1.4.12 MapReduce过程中的序列化与反序列化 PAGEREF _Toc392013760 \h 20 HYPERLINK \l _Toc392013761 1.4.13 √HDFS数据结构 PAGEREF _Toc392013761 \h 25 HYPERLINK \l _Toc392013762 1.4.14 MapReduce框架 PAGEREF _Toc392013762 \h 26 HYPERLINK \l _Toc392013763 1.4.15 MapReduce工作机制 PAGEREF _Toc392013763 \h 39 HYPERLINK \l _Toc392013764 1.4.16 推测执行【优点】 PAGEREF _Toc392013764 \h 42 HYPERLINK \l _Toc392013765 1.4.17 重用JVM【优化】 PAGEREF _Toc392013765 \h 43 HYPERLINK \l _Toc392013766 1.4.18 IDS PAGEREF _Toc392013766 \h 43 HYPERLINK \l _Toc392013767 1.4.19 输入格式 PAGEREF _Toc39

文档评论(0)

1亿VIP精品文档

相关文档