24HDFS简介Hadoop大数据平台搭建32课件讲解.pptxVIP

  • 1
  • 0
  • 约1.64千字
  • 约 18页
  • 2026-03-06 发布于陕西
  • 举报

24HDFS简介Hadoop大数据平台搭建32课件讲解.pptx

邢台职业技术学院柴旭光《Hadoop大数据平台搭建》2-4HDFS简介

课程学习目标和学习内容学习目标掌握HDFS的基本概念掌握HDFS的架构学习内容

CONTENTS学习内容12HDFS文件系统简介HDFS的特点3HDFS的架构

01HDFS简介

HDFS简介HDFS(HadoopDistributedFilesystem)是一个易于扩展的分布式文件系统,运行在成百上千台低成本的机器上。它与现有的分布式文件系统有许多相似之处,都是用来存储数据的系统工具,而区别于HDFS具有高度容错能力,旨在部署在低成本机器上。HDFS主要用于对海量文件信息进行存储和管理,也就是解决大数据文件(如TB乃至PB级)的存储问题。

HDFS简介NameNode是HDFS集群的主服务器,通常称为名称节点或者主节点。一旦NameNode关闭,就无法访问Hadoop集群。NameNode主要以元数据的形式进行管理和存储,用于维护文件系统名称并管理客户端对文件的访问;NameNode记录对文件系统名称空间或其属性的任何更改操作;HDFS负责整个数据集群的管理,并且在配置文件中可以设置备份数量,这些信息都由NameNode存储。1.NameNode(名称节点)

HDFS简介DataNode是HDFS集群中的从服务器,通常称为数据节点。文件系统存储文件的方式是将文件切分成多个数据块,这些数据块实际上是存储在DataNode节点中的,因此DataNode机器需要配置大量磁盘空间。它与NameNode保持不断的通信,DataNode在客户端或者NameNode的调度下,存储并检索数据块,对数据块进行创建、删除等操作,并且定期向NameNode发送所存储的数据块列表。2.DataNode(数据节点)

HDFS简介每个磁盘都有默认的数据块大小,这是磁盘进行数据读/写的最小单位,HDFS同样也有块(block)的概念,它是抽象的块,而非整个文件作为存储单元,在Hadoop2.x版本下,默认大小是128M,且备份3份,每个块尽可能地存储于不同的DataNode中。按块存储的好处主要是屏蔽了文件的大小,提供数据的容错性和可用性。3.Block(数据块)

HDFS简介Rack是用来存放部署Hadoop集群服务器的机架,不同机架之间的节点通过交换机通信,HDFS通过机架感知策略,使NameNode能够确定每个DataNode所属的机架ID,使用副本存放策略,来改进数据的可靠性、可用性和网络带宽的利用率。4.Rack(机架)

HDFS简介元数据从类型上分可分三种信息形式,一是维护HDFS文件系统中文件和目录的信息,例如文件名、目录名、父目录信息、文件大小、创建时间、修改时间等;二是记录文件内容存储相关信息,例如文件分块情况、副本个数、每个副本所在的DataNode信息等;三是用来记录HDFS中所有DataNode的信息,用于DataNode管理。5.Metadata(元数据)

02HDFS特点

HDFS简介随着互联网数据规模的不断增大,对文件存储系统提出了更高的要求,需要更大的容量、好更的性能以及安全性更高的文件存储系统,与传统分布式文件系统一样,HDFS分布式文件系统也是通过计算机网络与节点相连,也有传统分布式文件系统的优点和缺点。6.HDFS特点

HDFS简介高容错流式数据访问支持超大文件高数据吞吐量……优点

HDFS简介优点缺点高延迟不适合小文件存取不适合并发写入……

03HDFS架构

HDFS架构HDFS是一个分布式的文件系统,相比普通的文件系统来说更加复杂,因此在学习HDFS的操作之前有必要先来学习一下HDFS的存储架构。1.HDFS架构

HDFS架构HDFS采用主从架构(Master/Slave架构)。HDFS集群是由一个NameNode和多个的DataNode组成。

邢台职业技术学院柴旭光《Hadoop大数据平台搭建》感谢您的观看

文档评论(0)

1亿VIP精品文档

相关文档