HADOOP基础介绍概论.pptxVIP

  • 5
  • 0
  • 约1.58千字
  • 约 53页
  • 2016-07-22 发布于湖北
  • 举报
HADOOP基础介绍概论

Hadoop基础介绍与实践;目录;1.希望达到的目标;2.Hadoop起源;Hadoop是什么? ;Hadoop创始人Doug Cutting ;google的三大论文;Why hadoop?;Hadoop能用在什么地方?;3.Hadoop基本构成;Hadoop与云计算;Hadoop基础组件;Hadoop生态系统;HDFS—— Hadoop生态圈的基本组成部分是Hadoop分布式文件系统(HDFS)。HDFS是一种数据分布式保存机制,数据被保存在计算机集群上。数据写入一次,读取多次。HDFS为HBase等工具提供了基础。 MapReduce—— Hadoop的主要执行框架是MapReduce,它是一个分布式、并行处理的编程模 型。MapReduce把任务分为map(映射)阶段和reduce(化简)。开发人员使用存储在HDFS中数据(可实现快速存储),编写Hadoop的 MapReduce任务。由于MapReduce工作原理的特性, Hadoop能以并行的方式访问数据,从而实现快速访问数据。 Hbase——HBase是一个建立在HDFS之上,面向列的NoSQL数据库,用于快速读/写大量数据。HBase使用Zookeeper进行管理,确保所有组件都正常运行。 Spark ——为了提高MapReduce的计算效率,伯克利开发了spark,spark可看做基于内存的MapReduce实现,

文档评论(0)

1亿VIP精品文档

相关文档