- 3
- 0
- 约1.54千字
- 约 38页
- 2016-11-17 发布于湖北
- 举报
Hadoop原理介绍;Hadoop概述
Hadoop介绍
Hadoop原理
Hadoop编程;Hadoop是一个开源的、可靠的、可扩展的分布式并行计算框架
主要组成:分布式文件系统HDFS和MapReduce算法执行
作者:Doug Cutting
语言:Java,支持多种编程语言,如:Python、C++;Hadoop是Google的集群系统的开源实现
Google集群系统:GFS(Google File System)、MapReduce、BigTable
Hadoop主要由HDFS(Hadoop Distributed File System Hadoop分布式文件系统)、MapReduce和HBase组成
Hadoop的初衷是为解决 Nutch 的海量数据爬取和存储的需要
Hadoop于2005年秋天作为 Lucene的子项目Nutch的一部分正式引入Apache基金会。
名称起源: Doug Cutting儿子的黄色大象玩具的名字
;Hadoop概述
Hadoop介绍
Hadoop原理
Hadoop编程;什么是大数据;大数据处理的需求和特点;大数据VS传统数据;并行关系数据库vs MPP/Hadoop;MPP vs. Hadoop/Hive/HBase;Hadoop生态圈;Core:一套分布式文件系统以及支持Map-Reduce的计算框架
Avro:定义了一种用于支持大数
原创力文档

文档评论(0)