实验3 Hadoop-Mapreduce实践—13级计师2班白涵冰.doc

实验3 Hadoop-Mapreduce实践—13级计师2班白涵冰.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验3 Hadoop-Mapreduce实践—13级计师2班白涵冰

西北师范大学计算机科学与工程学院学生实验报告 学号 201371010201 专业 计算机科学与技术 班级 13级计师2班 姓名 白涵冰 课程名称 云计算 课程类型 专业选修 实验名称 Hadoop -Mapreduce实践 实验目的: 1、搭建Hadoop Mapreduce的Eclipse开发环境; 2、通过Wordcount实例,体会Mapreduce程序的基本思想; 3、体会在Hadoop集群下执行任务的过程。 实验要求及内容: 一、实验要求: 搭建环境; 1)创建Mapreduce工程:WordCount,导入Wordcount Mapreduce程序源码。 2)在Hadoop伪分布集群上执行该任务。 3)查阅资料,大致理解map、reduce函数的逻辑;大致理解提交mapreduce任务的过程(main函数) 4)Hadoop集群(伪分布)运行在虚拟机上。最简单的方法是,Eclipse也在虚拟机上。下一步,Hadoop集群将分布部署。 二、搭建Hadoop Mapreduce的Eclipse开发环境 1、安装并启动eclipse 解决jdk路径问题: 2、安装Eclipse Hadoop插件 (1)下载Hadoop-Eclipse-Plugin-1.2.1.jar并拷贝到Eclipse安装目录下的plugins文件夹下 (2)重启Eclipse 3、配置Eclipse (1)Window-Open Perspective (2)选择Map/Reduce (3)在对话框中选择hadoop的安装路径(bin的上级目录) 4、在Eclipse中配置Hadoop集群HDFS的URL (1)window-Show View (2)选择Map/Reduce Locations (3)New Hadoop location 在Map/Reduce Locations视图中单击右键,选择New Hadoop location (4)输入Hadoop HDFS基本信息 三、环境测试 1、启动Hadoop 2、在工程中会看到DFS Locations 3、HDFS的内容与命令看到的是一致的(所连接Hadoop集群的HDFS)。 HDFS创建文件夹、上传文件后要刷新或者重新连接。(右键) 四、MapReduce编程,通过Wordcount实例,体会Mapreduce程序的基本思想 1、New- Mapreduce Project 2、导入WordCount.java 3、运行准备 创建一个文本文件(可在Eclipse工程中创建),如:word.txt,上传至HDFS(可以使用HDFS命令,也可以在Eclipse中做) 4、运行配置 (1)在Project视图中,选择WordCount.java,右键选择如下: (2)输入运行参数:输入文件,输出文件夹 说明:输出文件夹可以不事先建立。文件是在HDFS上。 结果显示: 实验总结: 通过这次实验学习到了HDFS与MapReduce的关系:HDFS在集群生实现了分布式文件系统,MapReduce在集群上实现了分布式计算和任务处理;.HDFS在MapReduce任务处理过程中提供了对文件操作和存储的支持,使得MapReduce有更好的运行环境。MapReduce在HDFS的基础上实现任务的分发、跟踪、执行等工作,并收集结果。 实验评语: 实验成绩 教师签名

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档