- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
山西职业技术学院《Hadoop大数据技术与项目实战》
HQL统计分析案例
一、任务描述
之前学习了HQL语句基本操作,本任务在此基础上完成一个统计分析案例,案例
要求从一张表中将每个班级95分以上的人数统计出来,存放到另一个表中,并进行结
果查询。
首先要创建t_stu表,导入准备好的数据,对其中的数据进行统计计算,计算出每
个班级95分以上的总人数,再创建t_result表,将计算结果存入该表中。
二、能力目标
1.能理解案例思路
2.会对Hive表中的数据进行统计、计算
三、任务准备
1.启动Hadoop集群
2.启动Hive服务
四、任务实施
1.创建t_stu数据表
切换到db_test数据库。
hive(default)usedb_test;
输入如下建表语句,在db_test数据库中创建t_stu数据表。
hive(db_test)createtablet_stu(
idint,
namestring,
sexstring,
1
山西职业技术学院《Hadoop大数据技术与项目实战》
ageint,
scoreint,
classstring
)
rowformatdelimitedfieldsterminatedby,;
2.准备数据
复制一个新的node1会话窗口,切换到/opt/testData目录下。
[bigdata@node1~]$cd/opt/testData/
编辑data.txt文件,准备输入数据。
[bigdata@node1testData]$vimdata.txt
在data.txt中输入以下内容,输入“:wq”保存退出。
1,zhangsan,man,20,95,java
2,lisi,man,22,90,java
3,wangwu,man,22,98,java
3.加载数据
切换到Hive命令窗口,将data.txt中的数据加载到t_stu表中。
hive(db_test)loaddatalocalinpath/opt/testData/data.txtintotablet_stu;
查看t_stu表中的数据。
hive(db_test)select*fromt_stu;
OK
t_stu.idt_stu.namet_stu.sext_stu.aget_stu.scoret_stu.class
1zhangsanman2095java
2lisiman2290java
3wangwuman2298java
4.创建存放统计结果的数据表t_result
在hive命令行中输入如下建表语句,创建t_result数据表。
2
山西职业技术学院《Hadoop大数据技术与项目实战》
hive(db_test)createtablet_result(
classstring,
cntint
)
rowformatdelimitedfieldsterminatedby,;
5.统计并将结果加载到t_result表中
在Hive命令行中输入如下语句,统计t_stu表中95分以上的人数以及所在班级,
并插入到t_result表中。
hive(db_test)insertintot_result
selectclass,count(*)
您可能关注的文档
- Hadoop大数据技术与项目实战 教案 模块2 大数据平台部署.docx
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.2 Sqoop数据迁移实训指导书.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.1 pyecharts可视化工具介绍.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.2 导入数据、绘制大屏标题.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.4 绘制象形柱状图、水球图.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.7 数据大屏展示.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 辅助实训指导书——导入uzet.sql数据库文件至虚拟机数据库.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 模块5 项目数据可视化展示.pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.4 绘制象形柱状图(沉默用户数).pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.7 安装bs4第三方库.pdf
文档评论(0)