- 7
- 0
- 约1.21万字
- 约 18页
- 2017-04-22 发布于湖北
- 举报
Hadoop管理
一、实验目的
1、熟悉Hadoop文件结构。
2、了解Hadoop集群运行状态。
3、掌握Hadoop集群管理监控管理工具。
4、掌握Hadoop日常监控维护管理的相关方法。
二、实验原理
Hadoop 中的分布式文件系统 HDFS 由一个管理结点 ( NameNode )和N个数据结点 ( DataNode )组成,每个结点均是一台普通的计算机。在使用上同我们熟悉的单机上的文件系统非常类似,一样可以建目录,创建,复制,删除文件,查看文件内容等。但其底层实现上是把文件切割成 Block,然后这些 Block 分散地存储于不同的 DataNode 上,每个 Block 还可以复制数份存储于不同的 DataNode 上,达到容错容灾之目的。NameNode 则是整个 HDFS 的核心,它通过维护一些数据结构,记录了每一个文件被切割成了多少个 Block,这些 Block 可以从哪些 DataNode 中获得,各个 DataNode 的状态等重要信息。
MapReduce 是 Google 公司的核心计算模型,它将复杂的运行于大规模集群上的并行计算过程高度的抽象到了两个函数,Map 和 Reduce, 这是一个令人惊讶的简单却又威力巨大的模型。适合用 MapReduce 来处理的数据集(或任务)有一个基本要求: 待处理的数据集可以分解成许多小的数据集,而且每一个小数
您可能关注的文档
最近下载
- 塑料压延成型设备.PPT VIP
- 飞机系统与附件 主起落架结构和舱门 b737-800起落架第一讲.ppt VIP
- 飞机系统与附件 前起落架收放、主起落架收放 b737-800空地系统、位置警告.pptx VIP
- 飞机系统与附件 前起落架收放、主起落架收放 b737-800起落架收放.ppt VIP
- 光伏电站运行规程.pdf VIP
- 飞机系统与附件 前起落架结构和舱门 b737-800前起落架及舱门.ppt VIP
- 津上S205AA使用说明书.pdf VIP
- 光伏电站绩效考核指标.docx
- 塑料成型加工技术第10章 压延成型.ppt VIP
- 【年产8万吨合成氨厂废热锅炉工艺设计15000字】.docx
原创力文档

文档评论(0)