- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
山西职业技术学院《Hadoop大数据技术与项目实战》
本周回流用户数据表设计及数据加载实训指导书
一、任务描述
本周回流用户,是指某一用户设备在上周之前登录过,但上周没有登录,同时在本
周登录过,且不是本周的新增用户。
创建ADS层的本周回流用户数据表,包含统计日期、统计日期所在周、回流设备
数字段,本节统计在一个月的时间周期内,设定某一统计日期,然后统计出本周回流用
户数,即从本周活跃用户中去掉本周新增的用户,将上周活跃用户查询出来,再从两份
数据中获取到本周活跃但上周没有活跃的用户。
二、能力目标
1.能理解ADS层本周回流用户数据表的设计意义
2.掌握CONCAT函数的使用方法
3.能灵活运用LEFTJOIN及Unionall完成查询操作
三、任务准备
1.启动HDFS及YARN服务
2.启动Hive元数据服务及客户端
四、任务实施
1.创建ADS层本周回流用户数据表ads_back_count
切换到uzest数据库,执行删除同名表操作。
hive(default)useuzest;
hive(uzest)DROPTABLEIFEXISTSads_back_count;
1
山西职业技术学院《Hadoop大数据技术与项目实战》
接下来创建本周回流用户数据表ads_back_count,在本表中,包含有3个字段,
dt是统计日期字段,wk_dt是统计日期所在周字段,wastage_count是回流设备数字段。
执行如下建表语句。
hive(uzest)createtableifnotexistsads_back_count(
`dt`stringCOMMENT统计日期,
`wk_dt`stringCOMMENT统计日期所在周,
`wastage_count`BIGINTCOMMENT回流设备数
)
ROWformatdelimited
FIELDSTERMINATEDBY\t
location/project/offlineDataWarehouse/uzest.db/ads/ads_back_count
;
2.加载ads_back_count表数据
统计2021年4月30日所在周的回流用户数,执行如下HQL语句。
hive(uzest)INSERToverwriteTABLEads_back_count
Select*fromads_back_count
Unionall
SELECT--3.从两份数据中,获取到本周活跃但上周没有活跃的
用户
2021-04-30,
CONCAT(date_add(next_day(2021-04-30,MO),-7),_,d
ate_add(next_day(2021-04-30,MO),-1)),
count(*)
FROM
(
SELECT--1.从本周活跃用户中去掉了本周新增的用户
mid_id
FROMdwt_uv_topic
2
山西职业技术学院《Hadoop大数据技术与项目实战》
WHERElogin_date_last=date_add(next_day(2021
您可能关注的文档
- Hadoop大数据技术与项目实战 教案 模块2 大数据平台部署.docx
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.2 Sqoop数据迁移实训指导书.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.1 pyecharts可视化工具介绍.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.2 导入数据、绘制大屏标题.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.4 绘制象形柱状图、水球图.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.7 数据大屏展示.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 辅助实训指导书——导入uzet.sql数据库文件至虚拟机数据库.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 模块5 项目数据可视化展示.pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.4 绘制象形柱状图(沉默用户数).pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.7 安装bs4第三方库.pdf
- Hadoop大数据技术与项目实战 实训指导书——4.6.5 用户留存率数据表设计及数据加载.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.1 项目数据源及产生方法.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.2 Flume数据采集脚本设计.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.3 拦截器创建流程.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.6Flume数据采集执行脚本及实现.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.7 Flume数据消费脚本设计.pdf
- Hadoop大数据技术与项目实战 实训指导书——3.2.8 Flume数据消费执行脚本及实现.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.1 大数据相关开发软件安装.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.2 Linux系统环境配置.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 2.3 Hadoop分布式集群环境搭建.pdf
最近下载
- 2023江苏常熟农村商业银行招聘40人笔试历年典型考题及考点剖析附带答案详解.docx
- 2023年武汉科技大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案).docx VIP
- XX公司各生产车间绩效考核制度成本管理考核积分办法.doc
- 部编版道德与法治四年级下册 5合理消费 教学课件(两课时).ppt
- 大枣采摘机设计.docx
- 王牌教师的课堂管理术心得.pptx
- 电工(四级)理论知识考核要素细目表.pdf VIP
- 房地产开发,招标流程概要.doc
- 2023年武汉科技大学计算机科学与技术专业《操作系统》科目期末试卷B(有答案).docx VIP
- 食品安全追溯管理制度.pdf VIP
文档评论(0)