- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop数据分析平台 第2周
2012.8.25
DATAGURU专业数据分析网站
参考书
2012.8.25
DATAGURU专业数据分析网站 2
参考书
2012.8.25
DATAGURU专业数据分析网站 3
准备与配置安装环境
安装虚拟机和linux ,虚拟机推荐使用vmware ,PC可以使用workstation ,服务器可
以使用ESXi ,在管理上比较方便。ESXi还可以通过拷贝镜像文件复制虚拟机,复制后
自动修改网卡号和ip ,非常快捷。如果只是实验用途,硬盘大约预留20-30G空间。
以Centos为例,分区可以选择默认,安装选项选择Desktop Gnome ,以及Server、
Server GUI即可。其它Linux ,注意选项里应包括ssh ,vi (用于编辑配置文件),perl
等(有些脚本里包含perl代码需要解析)
到Oracle官网下载java jdk 安装包,并且进行安装
2012.8.25
DATAGURU专业数据分析网站 4
三种运行模式
单机模式:安装简单,几乎不用作任何配置,但仅限于调试用途
伪分布模式:在单节点上同时启动namenode、datanode、jobtracker 、tasktracker
、secondary namenode等5个进程,模拟分布式运行的各个节点
完全分布式模式:正常的Hadoop集群,由多个各司其职的节点构成
2012.8.25
DATAGURU专业数据分析网站 5
伪分布式模式的安装和配置步骤
下载并解压Hadoop安装包,为了和教材一致,选用了0.20.2版本
进入Hadoop的解压目录,编辑conf/hadoop-env.sh文件(注意0.23版后配置文件的
位置有所变化)
编辑conf目录下core-site.xml、hdfs-site.xml和mapred-site.xml三个核心配置文件
配置ssh ,生成密钥,使到ssh可以免密码连接localhost
格式化HDFS
使用bin/start-all.sh启动Hadoop
使用bin/stop-all.sh关闭Hadoop
2012.8.25
DATAGURU专业数据分析网站 6
下载Hadoop
2012.8.25
DATAGURU专业数据分析网站 7
解压hadoop
2012.8.25
DATAGURU专业数据分析网站 8
Hadoop配置有关文件
2012.8.25
DATAGURU专业数据分析网站 9
修改hadoop-env.sh文
您可能关注的文档
最近下载
- 数学中考总复习.doc VIP
- 限制型心肌病超声诊断与评估.pptx
- _【课件】第四章 三角形 +问题解决策略:特殊化课件北师大版七年级数学下册.pptx VIP
- 中考数学总复习第一轮考点复习(重庆专版).pptx VIP
- 2025在线网课《信息检索与科技写作( 理大)》单元测试考核答案.pdf VIP
- 高频精选:京东快递员ai面试题及答案.doc VIP
- 新北师大版初中七年级数学下册《第四章三角形问题解决策略:特殊化(1)》教学课件.pptx VIP
- 河北 2023年农信社储蓄知识考试真题模拟汇编(共213题).doc VIP
- 河北 2023年农信社基础知识考试真题模拟汇编(共672题).doc VIP
- 四川省宜宾市2023-2024学年高一下学期期末学业质量监测语文试卷(原卷版+解析版).docx VIP
文档评论(0)