- 2
- 0
- 约8.88千字
- 约 10页
- 2017-08-23 发布于江苏
- 举报
做数据仓库系统,ETL是关键的一环。说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具。回忆一下工作这么些年来,处理数据迁移、转换的工作倒还真的不少。但是那些工作基本上是一次性工作或者很小数据量,使用access、DTS或是自己编个小程序搞定。可是在数据仓库系统中,ETL上升到了一定的理论高度,和原来小打小闹的工具使用不同了。究竟什么不同,从名字上就可以看到,人家已经将倒数据的过程分成3个步骤,E、T、L分别代表抽取、转换和装载。
其实ETL过程就是数据流动的过程,从不同的数据源流向不同的目标数据。但在数据仓库中,ETL有几个特点,一是数据同步,它不是一次性倒完数据就拉到,它是经常性的活动,按照固定周期运行的,甚至现在还有人提出了实时ETL的概念。二是数据量,一般都是巨大的,值得你将数据流动的过程拆分成E、T和L。
现在有很多成熟的工具提供ETL功能,例如datastage、powermart等,且不说他们的好坏。从应用角度来说,ETL的过程其实不是非常复杂,这些工具给数据仓库工程带来和很大的便利性,特别是开发的便利和维护的便利。但另一方面,开发人员容易迷失在这些工具中。举个例子,VB是一种非常简单的语言并且也是非常易用的编程工具,上手特别快,但是真正VB的高手有多少?微软设计的产品通常有个原则是“将使用者当作傻瓜”,在这个原则下,微软的东西确实非常好用,但是对于开
您可能关注的文档
最近下载
- 2026 年石油化工企业循环水场设计规范(SH_T 3022-2025,附水质控制).docx VIP
- 【871】中建八局商务策划、双优化经典案例汇报46页PPT.pptx VIP
- (正式版)S-H-T 3227-2024 石油化工装置固定水喷雾和水(泡沫)喷淋灭火系统技术标准.docx VIP
- 综合医院建设标准(建标110_2008).doc VIP
- 6篇党支部与党员一对一谈心谈话记录.docx VIP
- 第3讲 水体的物理特性气体溶解特性.pdf VIP
- 给排水国标图集-04S520:埋地塑料排水管道施工.pdf VIP
- 胶带基础知识讲课稿.ppt
- 园林全套表格资料文档.docx
- 天然砂砾底基层试验段施工方案.pdf VIP
原创力文档

文档评论(0)