- 2
- 0
- 约2.95万字
- 约 44页
- 2026-06-10 发布于江西
- 举报
大数据应用与数据分析手册
第1章大数据基础架构与数据治理
1.1大数据技术栈概览
大数据技术栈是指支撑海量数据处理与分析的一整套软硬件工具组合,其核心包括Hadoop生态体系、Spark计算引擎、Flink实时计算、HBase与HDFS分布式存储以及YARN资源调度系统。在构建架构时,需根据业务场景选择合适技术:若需处理TB级日志进行离线分析,优先采用HDFS作为存储层配合MapReduce进行批处理;若需处理毫秒级实时流数据,则必须引入Flink构建流批一体处理管道。在数据流转过程中,技术栈通过“存储-计算-处理-服务”的闭环紧密
原创力文档

文档评论(0)