大数据处理引擎.ppt

大数据处理引擎

传统的海量数据分析方案;2006年6月;Apache Hadoop项目;Apache Hadoop;HDFS设计;HDFS体系结构;MapReduce-“分而治之”;聚集查询(SUM、AVG等);MapReduce;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce容错;;MapReduce调优;Yahoo Pig FaceBook Hive;HIVE体系结构;数据模型;Hive中的数据共享;Hive优点;Hive缺点;;;海量日志分析示例;Spark支持的操作;Spark优点;Hive体系结构;Shark体系结构;Stinger/Tez;Tez;Stinger体系结构;Impala;Impala体系结构;Impala支持的数据格式;大数据引擎测试;测试环境;测试环境(续);测试数据集;测试查询;测试查询(续);测试结果;测试结果(续1);测试结果(续2)

文档评论(0)

1亿VIP精品文档

相关文档