- 5
- 0
- 约 6页
- 2016-11-01 发布于安徽
- 举报
用Hadoop搭建分布式存储和分布式运算集群.doc
用Hadoop搭建分布式存储和分布式运算集群1. 列出使用的机器
普通PC,要求:cpu: 750M-1Gmem: 128Mdisk: 10G不需要太昂贵的机器。
机器名:finewine01finewine02finewine03
将finewine01设为主节点,其它的机器为从节点。
2. 下载和生成
从这里checkout,我选择trunk/repos/asf/lucene/hadoop/使用ant进行生成
3. 部署前的准备工作在主节点的start-all.sh脚本执行后,主节点和从节点的所有服务运行。即这个脚本将启动主节点的服务,并ssh到从所有的节点,继而启动从节点的服务。
start-all.sh这个脚本假定hadoop被安装在所有机器的同一个位置,每一台机器都用同一个路径存放hadoop的数据。
我们需要在每台机器上创建同样的目录结构。/hadoop/hadoop-install/hadoop-0.10.0 hadoop的0.10.0版的安装位置/filesystem hadoop文件系统的根/home 用户hadoop的主目录
以root登录到所有的机器,创建hadoop用户和目录结构。ssh -l root finewine01mkdir /hadoopmkdir /hadoop/hadoop-installmkdir /hadoop/filesystemmkdir /hadoop/homegroupadd hadoopuseradd -d /hadoop/home -g hadoop hadoopchown -R hadoop:hadoop /hadooppasswd hadoop hadooppassword
start-all.sh脚本要启动所有机器的服务,需要对所有的机器进行ssh无密码的登录的能力。因此我们需要在每台机器上创建一个ssh key。在这个例子中,主节点也需要启动自己的服务,因此主节点同样需要做无密码的ssh登录设置。
用vi编辑/hadoop/hadoop-install/hadoop-0.10.0/conf/hadoop-env.sh,将下面的环境变量设置:
export HADOOP_HOME=/hadoop/hadoop-install/hadoop-0.10.0export JAVA_HOME=/usr/java/jdk1.5.0_06export HADOOP_LOG_DIR=${HADOOP_HOME}/logsexport HADOOP_SLAVES=${HADOOP_HOME}/conf/slaves
这个文件还有很多变量,这些变量的设定影响hadoop的运行。比如你以后执行脚本时发生ssh错误,就需要调整其中的HADOOP_SSH_OPTS变量。同时需要注意的是,在初始的拷贝操作后,需要在设置hadoop-env.sh文件中的HADOOP_MASTER变量,这样程序才能通过rsync同步主节点的改变到所有的从节点上。
在主节点上创建ssh keys,然后复制到各个从节点上。这些操作必须由先前创建的hadoop用户完成。不要su成hadoop用户来做。开启一个新shell,以hadoop用户的身份登录来完成这些操作。cd /hadoop/homessh-keygen -t rsa (Use empty responses for each prompt)Enter passphrase (empty for no passphrase):Enter same passphrase again:Your identification has been saved in /hadoop/home/.ssh/id_rsa.Your public key has been saved in /hadoop/home/.ssh/id_rsa.pub.The key fingerprint is:a6:5c:c3:eb:18:94:0b:06:a1:a6:29:58:fa:80:0a:bc nutch@localhost
在主节点上,拷贝刚才创建的公共key到一个名为authorized_keys的文件:cd /hadoop/home/.sshcp id_rsa.pub authorized_keys
只需在主节点上运行ssh-kegen程序。其他节点的目录结构创建后,将刚才在主节点创建的keys通过scp拷贝到从节点的同样的目录上。scp /hadoop/home/.ssh/authorized_keys hadoop@finewine02:/hadoop/home/.ssh/authorized_ke
您可能关注的文档
- 牲畜养殖及屠宰加工项目可行性应用研究报告范文.doc
- 特变电工德缆企业形象片脚本.doc
- 特扶项目可行性应用研究报告.doc
- 特殊商品药品的营销的分析.doc
- 特约商户对银行卡风险的防范对策.doc
- 特高压联网前后H电网的功率振荡的分析论文-.doc
- 猪传染性胃肠炎防治技术.doc
- 猪场饲养管理及疫病流行防控策略.doc
- 猪常见病的诊疗及预防.doc
- 猪沙门氏菌赖药性及疫苗的应用研究进展.doc
- 人教版九年级英语Unit 4曾害怕课件3a-4c.pdf
- 雅思口语考题回顾:朗阁海外考试研究中心2019年10月10日Part 1考题总结.pdf
- 2026届高三地理一轮复习课件小专题河流袭夺.pptx
- 【名师原创】复习专题5 三角函数 作者:合肥市第八中学 蒲荣飞名师工作室.docx
- 高中数学一轮复习 微专题2 抽象函数.docx
- 高中数学——复习专题4 空间向量与立体几何.docx
- 高中数学一轮复习 微专题3 空间几何体中的截面、轨迹问题.docx
- 高中数学一轮复习 微专题4 空间几何体的最值、范围问题.docx
- 导流洞施工质量通病防治手册.docx
- 江苏省徐州市第一中学、徐市第三中学等五校2026届高三上学期12月月考历史试题含答案.docx
最近下载
- JUMO德国JUMO Inductive Conductivity Concentration and Temperature Transmitter CTI-750 说明书用户手册.pdf
- 07FJ05防空地下室移动柴油电站.docx VIP
- 三级公立医院绩效考核指标培训(附全文).ppt VIP
- (2026春新版)人教版三年级数学下册全册教案.doc
- 初中语文作文作业设计案例一等奖.docx VIP
- 半导体专利知识培训内容课件.pptx VIP
- 熔渣转盘离心粒化:液膜流动与破碎行为的深度剖析.docx
- 辽宁大学《软件工程》2021-2022学年期末试卷.docx VIP
- 《云计算与大数据》课程教学大纲.pdf VIP
- 中华人民共和国儿童社会福利机构基本规范.docx
原创力文档

文档评论(0)