基于Ubuntu的Hadoop集群安装与配置
一、实验目的
掌握Hadoop原理机制,熟悉Hadoop集群体系结构、核心技术。
2、安装和配置Hadoop集群。
二、实验原理
Hadoop分布式计算平台是由Apache软件基金会开发的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。
Hadoop 中的分布式文件系统 HDFS 由一个管理结点 ( NameNode )和N个数据结点 ( DataNode )组成,每个结点均是一台普通的计算机。在使用上同我们熟悉的单机上的文件系统非常类似,一样可以建目录,创建,复制,删除文件,查看文件内容等。但其底层实现上是把文件切割成 Block,然后这些 Block 分散地存储于不同的 DataNode 上,每个 Block 还可以复制数份存储于不同的 DataNode 上,达到容错容灾之目的。NameNode 则是整个 HDFS 的核心,它通过维护一些数据结构,记录了每一个文件被切割成了多少个 Block,这些 Block 可以从哪些 DataNode 中获得,各个 DataNode 的状态等重要信息。
MapReduce 是 Google 公司的核心计算模型,它将复杂的运
您可能关注的文档
最近下载
- 脱硫吸收塔本体安装施工方案.docx
- 铁路给水排水设计规范(TB 10010-2016).docx VIP
- 2025届山东省烟台市高三下学期二模物理试卷(原卷版+解析版).docx VIP
- 牛津小学英语语法书 4(干货).pdf VIP
- 奥的斯电梯服务器通用指南 V1.3.pdf
- 英剧剧本神探夏洛克台词本中英文对照精排版第一季第一集.pdf VIP
- 最全股票行业分类汇总.docx VIP
- 大学生创新创业大赛优秀作品范例.docx VIP
- 2024年注册电气工程师(供配电)《公共基础考试》真题及详解.pdf VIP
- 2026年南通中考化学备考全指南(知识点归纳,必考知识点、真题模拟试卷及解析).docx VIP
原创力文档

文档评论(0)