- 404
- 0
- 约9.39千字
- 约 11页
- 2023-06-05 发布于河北
- 举报
最新国家开放大学电大《大数据技术导论》实验报告
实验4 大数据去重
1.实验目的
通过Hadoop数据去重实验,学生可以掌握准备数据、伪分布式文件系统配置方法,以及
在集成开发环境Eclipse中实现Hadoop数据去重方法。
2.实验要求
了解基于Hadoop处理平台的大数据去重过程,理解其主要功能,并能够在Hadoop环境下
独立完成。
(1)制订实验计划。
(2)准备数据。
(3)伪分布式文件系统配置。
(4)在集成开发环境Eclipse中实现Hadoop数据去重。
3.实验内容
(1)制订实验计划。
(2)进入“/usr/local/hadoop”目录。
(3)准备数据。
(4)修改
您可能关注的文档
最近下载
- 第13课分解问题步骤(课件)三年级上册信息科技浙教版.pptx VIP
- 军考化学复习资料与核心考点.docx VIP
- 市政工程施工组织设计方案.doc VIP
- 金属非金属矿山井下六大系统建设规范(集合).pdf VIP
- 2025年无人机驾驶员执照特定机型(如DJIMatrice300)通信系统专题试卷及解析.pdf VIP
- 在线网课学习课堂《舰艇结构》单元测试考核答案.docx VIP
- 增资扩股可行性研究报告.docx VIP
- 企业员工个人信息保护制度及执行规范.docx VIP
- 国家教育考试标准化考点规范(暂行).doc VIP
- 湘南萧氏穆林公宗谱首卷20第二篇穆林公三子辅佐公脉下世系32.doc VIP
原创力文档

文档评论(0)