Hadoop生态系统3、Mapreduce(分布式计算框架).pptVIP

  • 31
  • 0
  • 约3.07千字
  • 约 18页
  • 2018-10-05 发布于天津
  • 举报

Hadoop生态系统3、Mapreduce(分布式计算框架).ppt

Hadoop生态系统3、Mapreduce(分布式计算框架).ppt

陈 辉 2016年3月 --hadoop生态系统 Page ? * Hadoop生态系统 1、Hadoop生态系统概况 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。 Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) 源自于Google的GFS论文,发表于2003年10月,HDFS是GFS克隆版。是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于在低成本的通用硬件上运行。 HDFS简化了文件的一致性模型,通过流式数据访问,提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。 Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) Client:切分文件;访问HDFS;与NameNode交互,获取文件位置信息;与DataNode交互,读取和写入数据。 NameNode:Master节点,在hadoop1.X中只有一个,管理HDFS的名称空间和数据块映射信息,配置副本策略,处理客户端请求。 DataNod

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档