基于Ubuntu的hadoop集群安装与配置资料.doc

下载文档 降价啦

4
0
约8.83千字
约 21页
2016-12-04 发布于湖北
举报
保障服务

基于Ubuntu的hadoop集群安装与配置资料.doc

基于Ubuntu的Hadoop集群安装与配置一、实验目的掌握Hadoop原理机制，熟悉Hadoop集群体系结构、核心技术。 2、安装和配置Hadoop集群。二、实验原理 Hadoop分布式计算平台是由Apache软件基金会开发的一个开源分布式计算平台。以Hadoop分布式文件系统（HDFS）和MapReduce（Google MapReduce的开源实现）为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。 Hadoop 中的分布式文件系统 HDFS 由一个管理结点 ( NameNode )和N个数据结点 ( DataNode )组成，每个结点均是一台普通的计算机。在使用上同我们熟悉的单机上的文件系统非常类似，一样可以建目录，创建，复制，删除文件，查看文件内容等。但其底层实现上是把文件切割成 Block，然后这些 Block 分散地存储于不同的 DataNode 上，每个 Block 还可以复制数份存储于不同的 DataNode 上，达到容错容灾之目的。NameNode 则是整个 HDFS 的核心，它通过维护一些数据结构，记录了每一个文件被切割成了多少个 Block，这些 Block 可以从哪些 DataNode 中获得，各个 DataNode 的状态等重要信息。 MapReduce 是 Google 公司的核心计算模型，它将复杂的运

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于Ubuntu的hadoop集群安装与配置资料.doc