- 5
- 0
- 约6.73千字
- 约 9页
- 2017-01-03 发布于湖南
- 举报
优化方案:ETL的过程原理和数据仓库建设
这篇论坛文章(赛迪网技术社区)根据笔者多年的数据仓库实施经验,同时结合ETL的过程原理和数据仓库建设方法归纳总结了以下优化的方案,详细内容请读者参考下文:
1.引言
数据仓库建设中的ETL(Extract, Transform, Load)是数据抽取、转换和装载到模型的过程,整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,SQL语句的效率将直接影响到数据仓库后台的性能。
目前,国内的大中型企业基本都具有四年以上计算机信息系统应用经验,积累了大量可分析的业务数据,这些信息系统中的数据需要通过搭建数据仓库平台才能得到科学的分析,这也是近几年数据仓库系统建设成为IT领域热门话题的原因。
2.优化的思路分析
数据仓库ETL过程的主要特点是:面对海量的数据进行抽取;分时段对大批量数据进行删除、更新和插入操作;面对异常的数据进行规则化的清洗;大量的分析模型重算工作;有特定的过程处理时间规律性,一般整个ETL过程需要在每天的零点开始到6点之前完成。所以,针对ETL过程的优化主要是结合数据仓库自身的特点,抓住需要优化的主要方面,针对不同的情况从如何采用高效的SQL入手来进行。
优化的实例分析
目前数据仓库建设中的后台数据库大部分采用Oracle,以下的SQL采用Oracle的语法来说明,所有的测试在Oracle9i环
您可能关注的文档
- 中从小数企业所得税纳税筹划五种功方法.doc
- 中件小型施工机具安全技术操作规个程.doc
- 中到国文纺织企业现状分析.doc
- 中到央空调y系统节能控制系统设计方案.doc
- 中回国计量学院本科生毕业设计(论文)撰q写规范.doc
- 中国2循环经济的发展现状与政末策建议.doc
- 中国3行政法律制度个小论文.doc
- 中国a涂料行业管理中准则.docx
- 中国1十大西装品牌及应聘果、社交等公共场合搭配礼仪注意事项.doc
- 中国b食品行业发展现状与投资分析r报告-灵核网.docx
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
最近下载
- 幼儿园集体教学活动观察记录20篇.pdf VIP
- 2025年绵阳市中考生物试题卷(含答案解析).docx
- 2025年高考全国1卷语文试卷及答案.pdf VIP
- 【高考真题】湖北省2024年普通高中物理学业水平等级性考试试卷(含答案).pdf VIP
- 5.3 正确运用复合判断 课件高中政治统编版选择性必修三逻辑与思维.pptx VIP
- 2026届贵州贵阳市七校联考高三上学期模拟预测物理试题(三)(含解析).docx VIP
- 法医人类学第五章一人及多人骨的检验.ppt VIP
- 法医临床学第二章法医临床学-活体损伤鉴定.ppt VIP
- T_CACM 1362-2021 中药饮片临床应用规范.docx VIP
- 口渴了-朋友帮你.ppt VIP
原创力文档

文档评论(0)