大数据分析系统架构之探讨..docxVIP

  • 28
  • 0
  • 约1.21万字
  • 约 24页
  • 2017-01-28 发布于重庆
  • 举报
大数据分析系统架构之探讨.

前言:3一、Hadoop生态圈:3Hadoop4HBase5Hive6Apache?Pig:6Impala:7Flume:7Sqoop:8Chukwa:8Mahout:8Hama:8Giraph:9Storm:9ZooKeeper:9Ambari:9Oozie:9Cloudera?Hue:9二、Spark生态圈:10Spark:10Spark SQL:11Spark Streaming:12MLLib:13GraphX :14SparkR :14Tachyon:15Mesos:16Yarn:16BlinkDB :17三、结构化数据生态圈:18DBSync:18OLAP19HANA19Spark与Hadoop的对比19Spark与Hadoop的结合20Spark的适用场景20案例:20大数据分析系统架构之探讨前言:对于大数据平台,本人也没实际实践过,所以,做为一个初学者的身份与大家探索这个问题,如有欠妥之处,请多多包涵!首先,先让我们来看看大数据平台架构的集装箱里可有哪些零件。一、Hadoop生态圈:数据计算平台:HadoopHadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布

文档评论(0)

1亿VIP精品文档

相关文档