- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据原理与技术实验报告
Principle and Technology of Big Data Report
所在学院:软件学院
所在班级:
学生姓名:
学 号:
指导教师:
教 务 处
实验一 Hadoop环境安装和使用
实验目的
1、掌握linux系统的安装调试,熟悉linux的用户管理和软件安装相关命令,熟悉linux下软件的使用;
掌握Hadoop的安装调试和使用。
一、实验内容
linux系统安装,按照Hadoop环境要求,安装相应版本的linux系统。
2、配置Hadoop的相关系统环境。
= 3 \* Arabic 3、安装配置Hadoop软件。
二、实验步骤
1、操作系统安装,Hadoop的运行环境为64位linux系统,本过程通过在虚拟机上安装ubuntu 64位系统来模拟。
在vmware workstation上新建一台虚拟机,利用镜像文件ubuntu-desktop-amd64.iso,在虚拟机上安装 ubuntu系统。(镜像文件同学们可以从网上自己下载/download/desktop,也可以从实验室飞秋共享下载。)
2、在安装的虚拟机 Ubuntu系统中增加一个名为 hadoop 的用户,使用此用户来安装运行Hadoop。
如果你安装 Ubuntu 的时候不是用的 “hadoop” 用户,那么需要增加一个名为 hadoop 的用户。建立用户时候注意相关权限。
(1)创建Hadoop用户
(2)为新用户设置密码
(3)为hadoop用户增加管理员权限
3、更新apt源。
用 hadoop 用户登录后,我们先运行apt-get update对软件源进行更新,思考为何要更新。
(1)更新apt
(2)更新完成
4、安装SSH、配置SSH无密码登陆。
集群、单节点模式都需要用到 SSH 登陆(类似于远程登陆,你可以登录某台 Linux 主机,并且在上面运行命令),Ubuntu 默认已安装了 SSH client,此外还需要安装 SSH server。自行查找相关资料,如何配置实现系统的SSH无密码登录。
(1)安装SSH server
(2)使用ssh localhost命令登陆本机
(3)利用ssh-keygen生成密钥,并将密钥加入到授权中
(4)使用ssh localhost 命令直接登陆(配置成SSH无密码登陆)
5、安装Java环境。
(1)安装JDK(由于Ubuntu16.04版本没有openjdk-7的安装包,所以需要下载openjdk安装包源)
(2)找到用于配置JAVA_HOME环境变量的路径
(3)配置JAVA_HOME环境变量
(4)检验是否设置正确
6、安装 Hadoop 2。
(1)校验下载的文件是否完整
(2)将Hadoop安装至/usr/local/中
(3)检查Hadoop是否可用
Hadoop伪分布式配置
修改配置文件 core-site.xml
修改配置文件 hdfs-site.xml:
配置完成后,执行 NameNode 的格式化: ./bin/hdfs namenode -format
开启hdfs:./sbin/start-dfs.sh
通过命令 jps 来判断是否成功启动:
运行Hadoop伪分布式实例
首先需要在 HDFS 中创建用户目录
查看运行结果的命令(查看的是位于 HDFS 中的输出结果):
启动Yarn
首先修改配置文件?mapred-site.xml,这边需要先进行重命名:
接着修改配置文件?yarn-site.xml:
然后就可以启动 YARN 了(需要先执行过?./sbin/start-dfs.sh):
关闭Yarn
实验二 HDFS 应用
实验目的
1、掌握HDFS的shell客户端的使用方法
2、掌握HDFS的java客户端编程;
实验内容
1、HDFS的开启和关闭。
2、基于SHELL的客户端命名使用,包括put,get,mkdir等基本操作。
3、java客户端编程实现判断路径是否存在,读写文件等操作。
实验步骤
开启HDFS
2、测试开启是否成功
3、关闭HDFS
4、shell命令的使用:
(1)在创建/user/hadoop作为hdfs的用户根目录:bin/hdfs dfs -mkdir -p /user/hadoop。
(2)将本地路径复制到该目录下:bin/hdfs dfs -put ...
创建文件:
(3)查看详情:bin/hdfs dfs -ls
(4)将hdfs文件系统下的文件复制到本地:bin/hdfs d
您可能关注的文档
- BGP在线实验报告.doc
- 实验6_传输层在线实验报告new.doc
- 实验6 OSPF协议在线实验报告.docx
- 2024年福建省龙岩企业人力资源管理师之一级人力资源管理师考试大全及答案(夺冠).docx
- 2024年辽宁省丹东市企业人力资源管理师之四级人力资源管理师考试题库大全附答案【B卷】.docx
- 2024年西藏山南地区企业人力资源管理师之一级人力资源管理师考试大全含答案【A卷】.docx
- 2024年西藏林芝地区企业人力资源管理师之四级人力资源管理师考试精品题库及参考答案(考试直接用).docx
- 2024年西藏林芝地区企业人力资源管理师之一级人力资源管理师考试精品题库附参考答案(B卷).docx
- 2024年西藏拉萨市企业人力资源管理师之一级人力资源管理师考试题库大全附答案【轻巧夺冠】.docx
- 2024年西藏那曲地区企业人力资源管理师之一级人力资源管理师考试真题题库附答案(典型题).docx
最近下载
- 国家森林公园总体规划规范.doc VIP
- Unit 5 The colourful world Part C Reading time大单元教学设计 人教PEP版三年级英语上册2024.pdf
- 2024年疾控大学习全球预防接种进展答案.docx VIP
- 《体教融合文献综述》.docx VIP
- 2018年国家公务员考试《公安专业科目》真题及解析.pdf VIP
- 古代汉字对外传播史.doc
- 采访课件模板.pptx VIP
- 三九控制法——欧博企管.ppt VIP
- GBT 50034-2024 建筑照明设计标准.docx VIP
- 人教PEP五年级上册英语《Unit 4 Read and write 》教学课件.pptx
文档评论(0)