- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
山西职业技术学院《Hadoop大数据技术与项目实战》
项目数据源及产生方法
一、任务描述
将模拟产生数据源的程序jar包上传至Hadoop集群,通过命令运行该jar包,产生
数据源中一天的模拟数据。
二、能力目标
1.掌握执行Java程序的命令
2.能根据要求产生一天的项目数据
三、任务准备
1.启动node1、node2、node3三台虚拟机
2.Xftp软件
3.OfflineDataWarehouse_DataSource-1.0-jar-with-dependencies.jar
四、任务实施
1.创建项目数据存放目录
在opt目录下创建project目录。
[bigdata@node1~]$cd/opt
[bigdata@node1opt]$mkdirproject
在project目录中,创建offlineDataWarehouse文件夹。
[bigdata@node1opt]$cdproject/
[bigdata@node1project]$mkdirofflineDataWarehouse
在offlineDataWarehouse目录中创建logs文件夹及jar文件夹。
[bigdata@node1project]$cdofflineDataWarehouse/
[bigdata@node1offlineDataWarehouse]$mkdirlogs
[bigdata@node1offlineDataWarehouse]$mkdirjar
1
山西职业技术学院《Hadoop大数据技术与项目实战》
2.上传产生数据的jar包
使用Xftp软件将模拟产生数据的程序jar包OfflineDataWarehouse_DataSource-1.
0-jar-with-dependencies.jar以拖拽的方式上传到/opt/project/offlineDataWarehouse/ja
r目录中。
使用ll命令可以查看到jar文件夹中已经上传的jar包,该jar包的作用是模拟生成
项目源数据。
[bigdata@node1jar]$ll
总用量3128
-rw-rw-r--.1bigdatabigdata32001101月OfflineDataWarehouse_DataSource-1.0
-jar-with-dependencies.jar
3.生成一天的模拟数据
本项目数据为2021年4月1日到4月30日共30天的模拟数据,本节以产生2021
年4月30日一天的数据为例,阐述生成数据的具体方法。
(1)修改集群日期
在产生模拟数据之前,应将当前集群日期修改为模拟数据的日期,此处以修改为
2021年4月30日为例,操作方法如下:
①在Xshell撰写栏中输入修改集群日期的命令:sudodate-s2021-04-30
②在Xshell撰写栏中输入bigdata用户密码123456
分别在node1、node2、node3三个节点中可以看到集群日期修改成功。
[bigdata@node1offline]$sudodate-s2021-04-30
[sudo]bigdata的密码:
2021年04月30日星期五00:00:00CST
(2)运行jar包,生成数据
2
山西职业技术学院《Hadoop大数据技术与项目实战》
在node1节点的/opt/project/offlineDataWarehouse/jar目录下,执行生成模拟数据
的命令。
[bigdata@node1jar]$java-classpathOfflineDataWarehouse_DataSource-1.0-jar-wit
h-depende
您可能关注的文档
- Hadoop大数据技术与项目实战 教案 模块2 大数据平台部署.docx
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.2 Sqoop数据迁移实训指导书.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.1 pyecharts可视化工具介绍.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.2 导入数据、绘制大屏标题.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.4 绘制象形柱状图、水球图.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.7 数据大屏展示.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 辅助实训指导书——导入uzet.sql数据库文件至虚拟机数据库.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 模块5 项目数据可视化展示.pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.4 绘制象形柱状图(沉默用户数).pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.7 安装bs4第三方库.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.2 Flume数据采集脚本设计.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.3 拦截器创建流程.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.6Flume数据采集执行脚本及实现.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.7 Flume数据消费脚本设计.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.8 Flume数据消费执行脚本及实现.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.1 大数据相关开发软件安装.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.2 Linux系统环境配置.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.3 Hadoop分布式集群环境搭建.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.8 Kafka集群环境搭建及应用.pdf
- Hadoop大数据技术与项目实战 实训指导书——2.1.1 IDEA的安装和配置.pdf
文档评论(0)