- 2
- 0
- 约1.09千字
- 约 2页
- 2021-01-01 发布于海南
- 举报
Hadoop HDFS 分布式文件系统简介
在大数据 时代,需要处理分析的数据集的大小已经远远超过了单台计算机的存储能力, 因此
需要将数据集进行分区并存储到若干台独立的计算机中。 但是, 分区存储的数据不方便管理
和维护,迫切需要一种文件系统来管理多台机器上的文件,这就是分布式文件系统。
分布式文件系统是一种允许文件通过网络在多台主机上进行分享的文件系统, 可让多台机器
上的多用户分享文件和存储空间。
HDFS 是 Hadoop 的一个分布式文件系统, 是 Hadoop 应用程序使用的主要分布式存储。
HDFS 被设计成适合运行在通用硬件上的分布式文件系统。
在 HDFS 体系结构中有两类结点:一类是 NameNode ,又叫“名称结点” ;另一类是
DataNode ,又叫“数据结点” 。这两类结点分别承担 Master 和 Worker 具体任务的执
行。
HDFS 总的设计思想是分而治之,即将大文件和大批量文件分布式存放在大
您可能关注的文档
最近下载
- 二年级标点符号的使用.docx VIP
- 急性前葡萄膜炎多学科决策模式中国专家共识(2025版).docx
- 中央空调采购安装投标方案(技术方案).docx
- fluent中的heat-release-rate-概述说明以及解释.doc VIP
- 华东理工大学新编日语教程4第7课.ppt VIP
- 新编日语教程4-课件-第5课.ppt VIP
- 惠州学院高等数学()期末试题参考答案.doc VIP
- GB 45673- 2025《危险化学品企业安全生产标准化通用规范》之“5.2安全生产责任制”专业解读与应用(编制-2025A0).docx VIP
- 【主编叶凡】大学物理(上+下)课后作业答案.doc VIP
- 陪诊师免责服务协议.pdf VIP
原创力文档

文档评论(0)