Hadoop原理介绍.pptxVIP

  • 3
  • 0
  • 约1.54千字
  • 约 38页
  • 2016-11-17 发布于湖北
  • 举报
Hadoop原理介绍;Hadoop概述 Hadoop介绍 Hadoop原理 Hadoop编程;Hadoop是一个开源的、可靠的、可扩展的分布式并行计算框架 主要组成:分布式文件系统HDFS和MapReduce算法执行 作者:Doug Cutting 语言:Java,支持多种编程语言,如:Python、C++;Hadoop是Google的集群系统的开源实现 Google集群系统:GFS(Google File System)、MapReduce、BigTable Hadoop主要由HDFS(Hadoop Distributed File System Hadoop分布式文件系统)、MapReduce和HBase组成 Hadoop的初衷是为解决 Nutch 的海量数据爬取和存储的需要 Hadoop于2005年秋天作为 Lucene的子项目Nutch的一部分正式引入Apache基金会。 名称起源: Doug Cutting儿子的黄色大象玩具的名字 ;Hadoop概述 Hadoop介绍 Hadoop原理 Hadoop编程;什么是大数据;大数据处理的需求和特点;大数据VS传统数据;并行关系数据库vs MPP/Hadoop;MPP vs. Hadoop/Hive/HBase;Hadoop生态圈;Core:一套分布式文件系统以及支持Map-Reduce的计算框架 Avro:定义了一种用于支持大数

文档评论(0)

1亿VIP精品文档

相关文档