传统的海量数据分析方案.pptxVIP

  • 1
  • 0
  • 约小于1千字
  • 约 45页
  • 2021-11-01 发布于重庆
  • 举报
传统的海量数据分析方案;;Apache Hadoop项目;Apache Hadoop;HDFS设计;HDFS体系结构;MapReduce-“分而治之”;聚集查询(SUM、AVG等);MapReduce;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce容错;;MapReduce调优;Yahoo Pig FaceBook Hive;HIVE体系结构;数据模型;Hive中的数据共享;Hive优点;Hive缺点;;;海量日志分析示例;Spark支持的操作;Spark优点;Hive体系结构;Shark体系结构;Stinger/Tez;Tez;Stinger体系结构;Impala;Impala体系结构;Impala支持的数据格式;大数据引擎测试;测试环境;测试环境(续);测试数据集;测试查询;测试查询(续);测试结果;测试结果(续1);测试结果(续2)

文档评论(0)

1亿VIP精品文档

相关文档