- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
RHEL52下的Hadoop分布式集群环境搭建
RHEL 5.2下的Hadoop分布式集群环境搭建文档
?
?
编辑:Nigel_Zeng 日期:2011-2-26
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
本文档修订历史:
版本号 修订人 修订说明 1.0.0Nigel_Zeng
(/nigelzeng) 新建 ?
?
?
?
?
?
?
一、?? 前言
偶然间同学跟我谈到hadoop分布式集群,恰好同学也需要自己去搭建hadoop平台,因此我想自己何不也搭建个hadoop平台玩玩呢。故有了这篇搭建记录。
?
?
?
?
二、?? Hadoop简介
Hadoop是Apache软件基金会所研发的开放源码并行运算编程工具和分布式文件系统,与MapReduce和Google档案系统的概念类似。
Hadoop is a top-level Apache project being built and used by a global community of contributors,using the Java programming language. Yahoo! has been the largest contributor to the project, and uses Hadoop extensively across its businesses.
Hadoop was created by Doug Cutting,who named it after his sons stuffed elephant. It was originally developed to support distribution for the Nutch search engine project.
?
?
?
?
?
三、?? 环境搭建
1、安装前的准备
·VMware Workstation ACE 6.02
·3台RHEL5.2虚拟机
·hadoop-0.20.2.tar.gz
·jdk-6u17-linux-i586.bin
?
?
2、安装JDK
JDK安装较为简单,不赘述。
Tip:
使用VMware Workstation 安装了3个RHEL 5.2系统。装好一个RHEL,并且安装好JDK,再利用VMware Workstation的克隆功能完成另外两个的安装。
?
3、??? 更改主机名、IP
?? IP设置:
?
hadoop1:00 ( NameNode )
hadoop2:01 ( DataNode )
hadoop3:02 ( DataNode )
?
# vi /etc/sysconfig/network-script/ifcfg-eth0
修改此文件为:
?
?
# service network restart重启网络服务
?
Tip:
在做hadoop1、hadoop2的IP设置的时候也许会出现这个问题,原因是克隆虚拟机的时候MAC地址还是一样的。
?
在这里点击“探测”修改MAC地址:
?
?
?
?? 更改主机名
修改/etc/sysconfig/network里面的hostname,这里改成你想改的主机名。再修改/ete/hosts文件,改成如下设置:
?
?
当然你也可以使用DNS来配置主机名与IP的映射,因为这里只是个局域网环境,所有就用修改hosts的方法来完成映射功能。
Tip:
1、关于这个hosts文件的配置,如果该台机器作Namenode用,则需要在hosts文件中加上集群中所有机器的IP地址及其对应的主机名;如果该台机器作Datanode用,则只需要在hosts文件中加上本机IP地址和Namenode机器的IP地址。
当然你也可以像我一样,三个hosts文件都一样。
2、对于Hadoop来说,在HDFS看来,节点分为Namenode和Datanode,其中Namenode只有一个,Datanode可以是很多;在MapReduce看来,节点又分为Jobtracker和Tasktracker,其中Jobtracker只有一个,Tasktracker可以是很多。我是将namenode和jobtracker部署在hadoop1上,hadoop2, hadoop3作为datanode和tasktracker。当然你也可以将namenode,datanode,jobtracker,tasktracker全部部署在一台机器上。
?
?
?? SSH设置
·工作原理
在Hadoop启动以后,Namenode是通过SSH(Secure Shell)来启动和停止各个节点上的各种守护进程的,这就需要在节点之间执行指令的时候是不需要输入密码的方式,故我们需要配置SSH使用无密码公钥认证
您可能关注的文档
- QtCreator使用体会与小技巧.doc
- QTLYJ7112009车内非金属材料气味性试验方法.docx
- QTP与QC的完美结合实现自动化测试框架业务组件测试.doc
- QT框架的C++编程.doc
- QT版连连看制作的实验报告.doc
- QuartusII中TsuTco的约束方法.doc
- QuartusII简明教程(完整版).doc
- QuartusII软件的使用方法.doc
- QYMJ201011方向柱零件镀锌技术条件.doc
- QZZN最牛的词语辨析(50页).doc
- 2023-2024学年广东省深圳市龙岗区高二(上)期末物理试卷(含答案).pdf
- 2023-2024学年贵州省贵阳市普通中学高一(下)期末物理试卷(含答案).pdf
- 21.《大自然的声音》课件(共45张PPT).pptx
- 2023年江西省吉安市吉安县小升初数学试卷(含答案).pdf
- 2024-2025学年广东省清远市九校联考高一(上)期中物理试卷(含答案).pdf
- 广东省珠海市六校联考2024-2025学年高二上学期11月期中考试语文试题.pdf
- 2024-2025学年语文六年级上册第4单元-单元素养测试(含答案).pdf
- 2024-2025学年重庆八中高三(上)月考物理试卷(10月份)(含答案).pdf
- 安徽省安庆市潜山市北片学校联考2024-2025学年七年级上学期期中生物学试题(含答案).pdf
- 贵州省部分校2024-2025学年九年级上学期期中联考数学试题(含答案).pdf
文档评论(0)