大数据基础 课件 课件3-6 新闻词频统计.pptx

大数据基础 课件 课件3-6 新闻词频统计.pptx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Bigdata浙江经贸职业技术学院训练3-1单元3大数据存储与计算新闻词频统计训练同步eclipseeclipse大数据基础pythonUnit3《大数据基础》.移动商务营销课程群

训练3-1:新闻词频统计训练目标在Hadoop系统运行MapReduce示例程序wordcount,对英文新闻稿进行词频统计训练解释将英文新闻文件上传到Hadoop系统的某个路径下,作为wordcount程序执行的输入数据,实现词频统计并输出结果

案例效果实现思路基本步骤准备一份英文新闻稿文件news.txt存放在CentOS系统的某个目录。打开CentOS的控制台,使用命令行模式进行后续的任务。执行start-dfs.sh,启动Hadoop系统:在Hadoop系统的用户文件夹/zjiet下创建级联目录data/wordcount在Hadoop系统的用户文件夹/zjiet下创建目录output将英文新闻文件news.txt从本地系统CentOS上传到Hadoop系统的wordcount文件夹内通过hadoopjar命令执行wordcount示例程序,以文件夹wordcount内的news.txt文件为输入数据,以文件夹output为输出结果存放路径,实现新闻词频统计新闻词频统计结果存放在output文件夹内的part-r-00000文件内,打开查看详细内容案例3-1:新闻词频统计

《大数据基础》在线开放课程组《大数据基础》.移动商务营销课程群

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档