大数据分析系统架构之探讨.docxVIP

  • 19
  • 0
  • 约1.72万字
  • 约 27页
  • 2022-09-07 发布于湖北
  • 举报
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。[6]大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。

---------宋停云与您分享---------- ---------宋停云与您分享---------- 、 、、 大数据分析系统架构之探讨 大数据分析系统架构之探讨 、 0 ---------宋停云与您分享---------- ---------宋停云与您分享---------- 前言 3 一、Hadoop 生态圈: 3 Hadoop 3 HBase 5 Hive 5 Apache Pig: 6 Impala: 6 Flume: 6 Sqoop: 7 Chukwa: 7 Mahout: 8 Hama: 8 Giraph: 8 Storm: 8 ZooKeeper: 8 Ambari: 8 Oozie: 8 Cloudera Hue: 9 二、Spark 生态圈: 9 Spark: 9 Spark SQL: 10 Spark Streaming: 11 MLLib: 12 GraphX : 12 SparkR : 13 Tachyon: 14 Mesos: 15 Yarn: 15 BlinkDB : 16 三、结构化数据生态圈: 16 ---------宋停云与您分享---------- ---------宋停云与您分享---------- DBSync: 1

文档评论(0)

1亿VIP精品文档

相关文档