2-hadoop管理技术报告.docxVIP

  • 7
  • 0
  • 约1.21万字
  • 约 18页
  • 2017-04-22 发布于湖北
  • 举报
Hadoop管理 一、实验目的 1、熟悉Hadoop文件结构。 2、了解Hadoop集群运行状态。 3、掌握Hadoop集群管理监控管理工具。 4、掌握Hadoop日常监控维护管理的相关方法。 二、实验原理 Hadoop 中的分布式文件系统 HDFS 由一个管理结点 ( NameNode )和N个数据结点 ( DataNode )组成,每个结点均是一台普通的计算机。在使用上同我们熟悉的单机上的文件系统非常类似,一样可以建目录,创建,复制,删除文件,查看文件内容等。但其底层实现上是把文件切割成 Block,然后这些 Block 分散地存储于不同的 DataNode 上,每个 Block 还可以复制数份存储于不同的 DataNode 上,达到容错容灾之目的。NameNode 则是整个 HDFS 的核心,它通过维护一些数据结构,记录了每一个文件被切割成了多少个 Block,这些 Block 可以从哪些 DataNode 中获得,各个 DataNode 的状态等重要信息。 MapReduce 是 Google 公司的核心计算模型,它将复杂的运行于大规模集群上的并行计算过程高度的抽象到了两个函数,Map 和 Reduce, 这是一个令人惊讶的简单却又威力巨大的模型。适合用 MapReduce 来处理的数据集(或任务)有一个基本要求: 待处理的数据集可以分解成许多小的数据集,而且每一个小数

文档评论(0)

1亿VIP精品文档

相关文档