RHEL52下的Hadoop分布式集群环境搭建.doc

下载文档 降价啦

2
0
约7.27千字
约 24页
2017-02-09 发布于重庆
举报
版权申诉
保障服务

RHEL52下的Hadoop分布式集群环境搭建.doc

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

RHEL52下的Hadoop分布式集群环境搭建

RHEL 5.2下的Hadoop分布式集群环境搭建文档 ? ? 编辑：Nigel_Zeng 日期：2011-2-26 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 本文档修订历史：版本号修订人修订说明 1.0.0Nigel_Zeng (/nigelzeng) 新建 ? ? ? ? ? ? ? 一、?? 前言偶然间同学跟我谈到hadoop分布式集群，恰好同学也需要自己去搭建hadoop平台，因此我想自己何不也搭建个hadoop平台玩玩呢。故有了这篇搭建记录。 ? ? ? ? 二、?? Hadoop简介 Hadoop是Apache软件基金会所研发的开放源码并行运算编程工具和分布式文件系统，与MapReduce和Google档案系统的概念类似。 Hadoop is a top-level Apache project being built and used by a global community of contributors,using the Java programming language. Yahoo! has been the largest contributor to the project, and uses Hadoop extensively across its businesses. Hadoop was created by Doug Cutting,who named it after his sons stuffed elephant. It was originally developed to support distribution for the Nutch search engine project. ? ? ? ? ? 三、?? 环境搭建 1、安装前的准备 ·VMware Workstation ACE 6.02 ·3台RHEL5.2虚拟机 ·hadoop-0.20.2.tar.gz ·jdk-6u17-linux-i586.bin ? ? 2、安装JDK JDK安装较为简单，不赘述。 Tip：使用VMware Workstation 安装了3个RHEL 5.2系统。装好一个RHEL，并且安装好JDK，再利用VMware Workstation的克隆功能完成另外两个的安装。 ? 3、??? 更改主机名、IP ?? IP设置： ? hadoop1：00 ( NameNode ) hadoop2：01 ( DataNode ) hadoop3：02 ( DataNode ) ? # vi /etc/sysconfig/network-script/ifcfg-eth0 修改此文件为： ? ? # service network restart重启网络服务 ? Tip: 在做hadoop1、hadoop2的IP设置的时候也许会出现这个问题，原因是克隆虚拟机的时候MAC地址还是一样的。 ? 在这里点击“探测”修改MAC地址： ? ? ? ?? 更改主机名修改/etc/sysconfig/network里面的hostname，这里改成你想改的主机名。再修改/ete/hosts文件，改成如下设置： ? ? 当然你也可以使用DNS来配置主机名与IP的映射，因为这里只是个局域网环境，所有就用修改hosts的方法来完成映射功能。 Tip： 1、关于这个hosts文件的配置，如果该台机器作Namenode用，则需要在hosts文件中加上集群中所有机器的IP地址及其对应的主机名；如果该台机器作Datanode用，则只需要在hosts文件中加上本机IP地址和Namenode机器的IP地址。当然你也可以像我一样，三个hosts文件都一样。 2、对于Hadoop来说，在HDFS看来，节点分为Namenode和Datanode，其中Namenode只有一个，Datanode可以是很多；在MapReduce看来，节点又分为Jobtracker和Tasktracker，其中Jobtracker只有一个，Tasktracker可以是很多。我是将namenode和jobtracker部署在hadoop1上，hadoop2, hadoop3作为datanode和tasktracker。当然你也可以将namenode，datanode，jobtracker，tasktracker全部部署在一台机器上。 ? ? ?? SSH设置 ·工作原理在Hadoop启动以后，Namenode是通过SSH(Secure Shell)来启动和停止各个节点上的各种守护进程的，这就需要在节点之间执行指令的时候是不需要输入密码的方式，故我们需要配置SSH使用无密码公钥认证