实验2 Hadoop开发环境部署.docxVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验2 Hadoop开发环境部署 Hadoop是一个能够对大数据进行分布式处理的软件架构,其可以通过可靠、高效、可伸缩的方式进行数据处理。Hadoop技术是推动大数据应用的重要引擎之一,可以使用该技术收集、清洗和分析大量结构化、半结构化和非结构化数据。运行环境部署是一项技术要求较高,但必须掌握的技术。Hadoop是大数据分布式处理平台,在大数据离线处理方面,尤其是批处理中得到了广泛的应用。 1.实验目的 通过Hadoop环境部署实验练习,学生可以掌握Hadoop系统安装方法、伪分布式Hadoop的安装方法和Eclipse开发环境的安装具体过程与使用方法,并能够灵活运用,进而为解决大数据分析问题奠定环境构建与部署的基础,不仅为后续的基于Hadoop环境的各个实验建立基础,而且可以提高工程实践能力。 2.实验要求 在理解本实验相关理论的基础上制订安装计划,独立完成Hadoop开发环境部署过程,主要内容如下所述。 (1)制订安装计划。 (2)安装SSH协议。 (3)安装OpenJDK1.8开发环境。 (4)Hadoop系统部署。 (5)伪分布式Hadoop环境部署。 (6)Eclipse开发环境的安装。 3.实验内容 (1)制订实验计划。 (2)完成SSH协议安装。 (3)完成OpenJDK1.8安装。 (4)完成Hadoop系统部署。 (5)完成伪分布式Hadoop环境部署。 (6)完成Eclipse开发环境的安装。 4.实验总结 通过本实验,使学生了解Hadoop的特点和总体结构,理解MapReduce程序的执行过程,掌握伪分布式Hadoop的安装方法和Eclipse开发环境的安装与使用方法。 5.思考拓展 (1)为什么需要安装SSH协议?说明SSH协议功能及安装方法。 (2)为什么需要安装OpenJDK1.8软件?说明OpenJDK1.8功能及安装方法。 (3)结合MapReduce程序执行过程,说明其并行处理的特性。 (4)结合Hadoop的处理过程,说明其离线处理特点。 (5)说明分布式Hadoop处理与伪分布式Hadoop处理的区别。 (6)说明Eclipse开发环境的优势。 答:Hadoop开发环境部署方法如下 Hadoop 伪分布式配置 创建Hadoop用户: sudo useradd -m hadoop -s /bin/bash # 创建hadoop用户 sudo passwd hadoop # 修改密码 sudo adduser hadoop sudo # 增加管理员权限 Shell 命令 \o 复制代码 \o 查看纯文本代码 注销并使用 Hadoop 用户登录,接着更新 apt 并且安装 vim: sudo apt-get update # 更新apt sudo apt-get install vim # 安装vim Shell 命令 \o 复制代码 \o 查看纯文本代码 安装SSH,配置无密码登录: sudo apt-get install openssh-server cd ~ mkdir .ssh # 可能该文件已存在,不影响 cd ~/.ssh/ ssh-keygen -t rsa # 会有提示,都按回车就可以 cat id_rsa.pub authorized_keys # 加入授权 Shell 命令 \o 复制代码 \o 查看纯文本代码 安装Java环境: sudo apt-get install openjdk-7-jre openjdk-7-jdk vim ~/.bashrc # 设置JAVA_HOME Shell 命令 \o 复制代码 \o 查看纯文本代码 在文件最前面添加如下单独一行: export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 使 JAVA_HOME 变量生效: source ~/.bashrc # 使变量设置生效 Shell 命令 \o 复制代码 \o 查看纯文本代码 安装 Hadoop 2: cd ~/下载 sudo tar -zxvf ./hadoop-2.6.0.tar.gz -C /usr/local # 解压到/usr/local中 cd /usr/local/ sudo mv ./hadoop-2.6.0/ ./hadoop # 将文件夹名改为hadoop sudo chown -R hadoop ./hadoop # 修改文件权限 Shell 命令 \o 复制代码 \o 查看纯文本代码

文档评论(0)

我爱学习 + 关注
实名认证
文档贡献者

学习使人进步

1亿VIP精品文档

相关文档