hadoop文本词频排序实验探讨.docx

大数据技术概论实验报告 文 本 词 频 排 序 姓名: 郭利强 专业: 工程管理专业 学号: 2015E8009064028 1. 实验要求 3 2. 环境说明 3 2.1 系统硬件 3 2.2 系统软件 3 2.3 安装与配置 3 3. 实验设计 10 3.1 设计思路 10 3.2 算法设计 10 3.3 程序和类的设计 11 4. 程序代码 16 4.1 WordCount.java代码 16 4.2 Pair.java代码 19 5. 实验输入和结果 20 5.1 实验输入 20 5.2 实验输出 21 5.3 实验结果分析 23 1. 实验要求 在Eclipse环境下编写WordCount程序,统计所有出现次数k次以上的单词计数,最后的结果按照词频从高到低排序输出。 2. 环境说明 2.1 系统硬件 处理器:Intel Core i3-2350M CPU@2.3GHz×4 内存:2GB 磁盘:60GB 2.2 系统软件 操作系统:Ubuntu 14.04 LTS 操作系统类型:32位 Java版本:1.7.0_85 Eclipse版本:3.8 Hadoop插件:hadoop-

文档评论(0)

1亿VIP精品文档

相关文档