大数据面试必备:深入数仓建设中ETL流程.pdfVIP

  • 1
  • 0
  • 约小于1千字
  • 约 1页
  • 2026-05-20 发布于北京
  • 举报

大数据面试必备:深入数仓建设中ETL流程.pdf

《024_数仓建设中的ETL到底指的?》

用的就是所谓的ETL:extract(抽取),transform(转换),load(装载),从一个地方抽取一

些数据进行各种处理和转换,接着装载到另外一个地方去,数据就是通过ETL来完成

的,发现了没有

ETL一般是通过什么方式来做呢,做一个小小的示范,SQL语句,比如说我们现在ODS层

的数据都在hive里,完全可以对一些hive里的表,执行一个SQL语句(ETL),举个例子写

一个SQL的伪代码

insertoverwritedwd_user_behaviour_log//完成了ETL的L,装载到另外一个表里去了

select各种函数和处理,时间格式,地理位置

(

select*fromods_android_user_behaviour_log

unionall//在这里的unionall,其实就是ETL里的T,转换

select*fromods_website_user_behaviour_log

unionall

select*fromods_applet_user_behav

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档