Hadoop2.0架构设计与原理.pptxVIP

  • 75
  • 0
  • 约9.58千字
  • 约 59页
  • 2017-11-25 发布于河北
  • 举报
Hadoop2.0架构设计与原理

Hadoop2.0架构设计与原理数据中心-Alan主要内容1Hadoop介绍2Hadoop原理3Hadoop YARN产生的背景 4Hadoop YARN基本架构运行在YARN上的计算框架5YARN 发展趋势6主要内容1Hadoop介绍2Hadoop原理3Hadoop YARN产生的背景 4Hadoop YARN基本架构5运行在YARN上的基本框架6YARN 发展趋势Hadoop概述 Hadoop是一个开源的、可靠的、可扩展的分布式并行计算框架主要组成:分布式文件系统HDFS和MapReduce算法执行作者:Doug Cutting语言:Java,支持多种编程语言,如:Python、C++Hadoop的起源Hadoop是Google的集群系统的开源实现Google集群系统:GFS(Google File System)、MapReduce、BigTableHadoop主要由HDFS(Hadoop Distributed File System Hadoop分布式文件系统)、MapReduceHadoop的初衷是为解决 Nutch 的海量数据爬取和存储的需要Hadoop于2005年秋天作为 Lucene的子项目Nutch的一部分正式引入Apache基金会。名称起源: Doug Cutting儿子的黄色大象玩具的名字目前最新稳定版本2.6.0什么是大数据数据集主要特点Volume:

文档评论(0)

1亿VIP精品文档

相关文档