2025年大数据技术原理题库及答案.docx

2025年大数据技术原理题库及答案

1.数据采集阶段,ETL与ELT的核心差异是什么?实际应用中如何选择?

ETL(抽取-转换-加载)与ELT(抽取-加载-转换)的核心差异在于数据转换发生的阶段。ETL在数据加载到目标存储前完成清洗、转换,依赖传统数据库的计算能力,适合数据量较小、转换逻辑复杂且对实时性要求不高的场景;ELT将转换延迟到数据加载到目标存储(如数据湖)后进行,利用分布式存储的弹性计算能力处理海量数据,适合数据量大、转换逻辑可灵活调整(如通过SQL或Spark作业实现)、需要保留原始数据的场景。选择时需综合考虑数据量(100TB时ELT更优)、转换复杂度(复杂规则优先ETL)、

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档