- 5
- 0
- 约1.58千字
- 约 53页
- 2016-07-22 发布于湖北
- 举报
HADOOP基础介绍概论
Hadoop基础介绍与实践;目录;1.希望达到的目标;2.Hadoop起源;Hadoop是什么?;Hadoop创始人Doug Cutting;google的三大论文;Why hadoop?;Hadoop能用在什么地方?;3.Hadoop基本构成;Hadoop与云计算;Hadoop基础组件;Hadoop生态系统;HDFS—— Hadoop生态圈的基本组成部分是Hadoop分布式文件系统(HDFS)。HDFS是一种数据分布式保存机制,数据被保存在计算机集群上。数据写入一次,读取多次。HDFS为HBase等工具提供了基础。
MapReduce—— Hadoop的主要执行框架是MapReduce,它是一个分布式、并行处理的编程模 型。MapReduce把任务分为map(映射)阶段和reduce(化简)。开发人员使用存储在HDFS中数据(可实现快速存储),编写Hadoop的 MapReduce任务。由于MapReduce工作原理的特性, Hadoop能以并行的方式访问数据,从而实现快速访问数据。
Hbase——HBase是一个建立在HDFS之上,面向列的NoSQL数据库,用于快速读/写大量数据。HBase使用Zookeeper进行管理,确保所有组件都正常运行。
Spark ——为了提高MapReduce的计算效率,伯克利开发了spark,spark可看做基于内存的MapReduce实现,
您可能关注的文档
最近下载
- 2026抖音内衣类目达人准入内衣泳衣类目准入考试题库解析.docx
- 玉柴YC6108G发动机零件图册.pdf VIP
- 无人机测绘-无人机航飞教学课件.ppt VIP
- 《力学、电磁学》习题答案详解(程稼夫).pdf VIP
- 2021年高考生物真题 新课标卷Ⅰ有答案word版.pdf VIP
- 2026年雄鹰杯小动物医师技能大赛必练题库(350题).doc VIP
- 2026住院医师规培-重庆-重庆住院医师规培(全科医学)历年参考题库含答案详解5卷试题.docx VIP
- 八年级数学下册 正方形中十字架模型(解析版).pdf VIP
- 玉柴YC4D120-20-D1008发动机零件图册.pdf VIP
- 税务自查报告模板(2篇).docx VIP
原创力文档

文档评论(0)