自己配置Hadoop220.doc

下载文档 降价啦

4
0
约3.38万字
约 29页
2016-12-30 发布于重庆
举报
版权申诉
保障服务

自己配置Hadoop220.doc

1、本文档共29页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

总体介绍虚拟机4台，分布在2个物理机上，配置基于hadoop的集群中包括4个节点： 1个 Master， 3个 Salve，节点之间局域网连接，可以相互ping通，Ip分布为： 12 hadoop1 （Master） 16 hadoop2 （Slave） 07 hadoop3 （Slave） 01 hadoop4 （Slave）操作系统为 RHEL5.4 64bit，GNU/Linux 2.6.9 Master机器主要配置NameNode和JobTracker的角色，负责总管分布式数据和分解任务的执行；3个Salve机器配置DataNode和TaskTracker的角色，负责分布式数据存储以及任务的执行。其实应该还应该有1个Master机器，用来作为备用，以防止Master服务器宕机，还有一个备用马上启用。后续经验积累一定阶段后补上一台备用Master机器。环境准备创建账户使用root登陆所有机器后，所有的机器都创建 hadoop 用户 useradd hadoop passwd hadoop 此时在 /home/ 下就会生成一个hadoop目录，目录路径为 /home/hadoop 使用hadoop用户登录并创建相关的目录定义需要数据及目录的存放路径：定义代码及工具存放的路径： mkdir -p /home/hadoop/source mkdir -p /home/hadoop/tools 定义数据节点存放的路径到根目录下的hadoop文件夹, 这里是数据节点存放目录，需要有足够的空间存放 mkdir -p /hadoop/hdfs mkdir -p /hadoop/tmp mkdir -p /hadoop/log 设置可写权限 chmod -R 777 /hadoop 定义java安装程序路径： mkdir -p /usr/java 安装JDK 1 将下载好的jdk-6u33-linux-x64-rpm.bin通过 SSH 上传到 /usr/java 下 scp -r ./jdk-6u32-linux-x64.bin root@hadoop1:/usr/java 2 进入 JDK 安装目录 cd /usr/java 且执行 chmod +x jdk-6u33-linux-x64-rpm.bin 3 执行 ./jdk-6u33-linux-x64-rpm.bin 4 配置环境变量，vi /etc/profile ，在行末尾添加 export JAVA_HOME=/usr/java/jdk1.6.0_33 export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:/lib/dt.jar export PATH=$JAVA_HOME/bin:$PATH 5 执行 chmod +x profile 将其变成可执行文件 6 使配置立即生效 source /etc/profile 7 执行 java -version 查看是否安装成功这个步骤所有机器都必须安装 [root@hadoop1 bin]# java -version java version 1.6.0_33 Java(TM) SE Runtime Environment (build 1.6.0_33-b04) Java HotSpot(TM) 64-Bit Server VM (build 20.8-b03, mixed mode) 修改主机名修改主机名，所有节点均一样配置 1 连接到主节点 12 ，修改 network ，执行 vi /etc/sysconfig/network ，修改 HOSTNAME=hadoop1 2 修改 hosts 文件，vi /etc/hosts ，在行末尾添加 : 12 hadoop1 16 hadoop2 07 hadoop3 01 hadoop4 3 执行 hostname hadoop1 4 执行 exit 后重新连接可看到主机名以修改 OK 其他节点也修改主机名后添加 Host, 或者 host 文件可以在后面执行 scp 覆盖操作配置SSH无密码登陆 SSH 无密码原理简介 : 首先在 hadoop1 上生成一个密钥对，包括一个公钥和一个私钥，并将公钥复制到所有的 slave(hadoop2-hadoop4)机器上。然后当 master 通过SSH连接slave时，slave就会生成一个随机数并用master的公钥对随机数进行加密，并发送给master。最后，master收到加密数之后再用私钥解密，并将解密数回传给slave，slave确认解密数无误之后就允许master不输入密码进行连接了具