- 41
- 0
- 约4.93千字
- 约 12页
- 2019-06-14 发布于浙江
- 举报
Hadoop云计算实验报告
Hadoop云计算实验报告
实验目的
在虚拟机Ubuntu上安装Hadoop单机模式和集群;
编写一个用Hadoop处理数据的程序,在单机和集群上运行程序。
实验环境
虚拟机:VMware 9
操作系统:ubuntu-12.04-server-x64(服务器版),ubuntu-14.10-desktop-amd64(桌面版)
Hadoop版本:hadoop 1.2.1
Jdk版本:jdk-7u80-linux-x64
Eclipse版本:eclipse-jee-luna-SR2-linux-gtk-x86_64
Hadoop集群:一台namenode主机master,一台datanode主机salve,
master主机IP为10.5.110.223,slave主机IP为10.5.110.207。
实验设计说明
主要设计思路
在ubuntu操作系统下,安装必要软件和环境搭建,使用eclipse编写程序代码。实现大数据的统计。本次实验是统计软件代理系统操作人员处理的信息量,即每个操作人员出现的次数。程序设计完成后,在集成环境下运行该程序并查看结果。
算法设计
该算法首先将输入文件都包含进来,然后交由map程序处理,map程序将输入读入后切出其中的用户名,并标记它的数目为1,形成word,1的形式,然后交由reduce处理,reduce将相同key值(也就是word)的value值收集起来,形成word,list of 1的形式,之后再将这些1值加起来,即为用户名出现的个数,最后将这个key,value对以TextOutputFormat的形式输出到HDFS中。
程序说明
UserNameCountMap类继承了org.apache.hadoop.mapreduce.Mapper,4个泛型类型分别是map函数输入key的类型,输入value的类型,输出key的类型,输出value的类型。
UserNameCountReduce类继承了org.apache.hadoop.mapreduce.Reducer,4个泛型类型含义与map类相同。
main函数通过addInputPath将数据文件引入该类,在通过setOutputPath将生成结果转为一个文件,实现生成结果,即统计结果的查看。
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
程序具体代码如附件中源程序。
实验过程
安装实验环境
安装ubuntu操作系统
打开VMware,在Home tab中单击“Create a New Virtual Machine”,
选择custom,选择虚拟硬件版本Workstation9.0,选择ios文件,next,
录入目标操作系统信息,包括Full name、Uer name和Password, next,
选择默认的选项,一般不做更改,最后确认信息,Finish,
安装成功后,会看到如下画面,
安装配置Samba
安装samba主要为了实现与windows操作系统的通讯,由于server版本的ubuntu没有自带图形操作界面,所以下载资料等操作不太方便,这也是安装samba的目的之一。
安装samba,输入如下命令:
安装vim
创建共享目录,并修改权限
配置samba。修改samba的配置文件/etc/samba/smb.conf ,将security=share,并在文件的末尾追加如下内容,
测试。在windows实机中,通过ip访问ubuntu虚拟机,可以见到share文件夹
安装配置JDK
首先,下载java开发工具包JDK。在本次试验中,我们下载的版本是jdk-7u80-linux-x64.gz。 解压安装到/usr/lib/jvm/目录下,更名为java-7-sun。
配置环境变量/etc/environment,
使配置生效
测试安装配置结果
在单节点(伪分布式)环境下运行HADOOP
添加Hadoop用户并赋予sudo权限
安装配置SSH
切换至hadoop用户,
配置密钥,使得hadoop用户能够无须输入密码,通过SSH访问localhost,
测试结果:
安装配置Hadoop
首先下载Hadoop,解压缩到/opt/hadoop目录下, 本次试验中我们下载的版本是hadoop-1.2.1-bin.tar.gz,更改目录名称为hadoop。
修改与hadoop相关的配置文件(在/opt/hadoo
您可能关注的文档
- Excle-VBA常用技巧-第02章-Worksheet对象.doc
- F5详细配置手册.doc
- FH-9001输电线路杆塔倾斜在线监测系统用户手册.doc
- flash-红星闪闪制作过程.doc
- FLUKE335钳形电流表使用方法.docx
- FME2013安装破解图解.docx
- FreeFreedom共享旅游电商创业策划.pptx
- FTP客户端与服务器设计与实现课设报告.doc
- futaba-cgy750中文版说明书.docx
- FXon-3A功能模块用户手册.doc
- 河南许昌市鄢陵县2025-2026学年高一上学期10月月考语文试题.docx
- 黑龙江省新时代高中教育联合体2025-2026学年高三上学期期中联考巩固卷(一)语文试题.docx
- 黑龙江省新时代高中教育联合体2025-2026学年高一上学期期中联考巩固卷(二)语文试题.docx
- 江苏省南京七校联合学情调研2026届高三上学期10月月考语文试题.docx
- 湖北省黄冈市部分学校2025-2026学年高一上学期期中考试语文试题.docx
- 江苏省连云港市灌南县2025-2026学年高一上学期期中考试语文试题.doc
- 江苏省高邮市2025-2026学年高二上学期10月调研测试语文试题.docx
- 湖北省黄冈市普通高中2024-2025学年高二上学期期中考试语文试题.docx
- 河北省衡水市2025-2026学年高三上学期第四次调考语文试题(解析版).docx
- 黑龙江省绥化市新时代2025-2026学年高一上学期期中联考语文试题.docx
原创力文档

文档评论(0)