- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HDFS应用场景、原理、基本架构及使用方法
LOGO
HDFS 2.0应用场景、原理、基本
架构及使用方法
讲师:董西成
议程
1. HDFS概述
2. HDFS基本架构和原理
3. HDFS程序设计
4. HDFS 2.0新特性
5. 总结
小象科技 2
让你的数据产生价值
HDFS是什么?
源自于Google的GFS论文
发表于2003年10月
HDFS是GFS克隆版
Hadoop Distributed File System
易于扩展的分布式文件系统
运行在大量普通廉价机器上,提供容错机制
为大量用户提供性能不错的文件存取服务
小象科技
让你的数据产生价值
HDFS优点
高容错性
数据自动保存多个副本
副本丢失后,自动恢复
适合批处理
移动计算而非数据
数据位置暴露给计算框架
适合大数据处理
GB、TB、甚至PB级数据
百万规模以上的文件数量
10K+节点规模
小象科技
让你的数据产生价值
HDFS优点
流式文件访问
一次性写入,多次读取
保证数据一致性
可构建在廉价机器上
通过多副本提高可靠性
提供了容错和恢复机制
小象科技
让你的数据产生价值
HDFS缺点
低延迟数据访问
比如毫秒级
低延迟与高吞吐率
小文件存取
占用NameNode大量内存
寻道时间超过读取时间
并发写入、文件随机修改
一个文件只能有一个写者
仅支持append
小象科技
让你的数据产生价值
议程
1. HDFS概述
2. HDFS基本架构和原理
3. HDFS程序设计
4. HDFS 2.0新特性
5. 总结
小象科技 7
让你的数据产生价值
分布式文件系统的一种实现方式
file1 file2
0.5 TB 1.2 TB
file1:node1,node2,node3
file1:node1
0.5 TB 1.2 TB file2:node2,node3,node4
file2:node3
您可能关注的文档
- H-Class教程_4_UPLC方法转换_2015.pdf
- H19 lncRNA可以结合并抑制S-腺苷高半胱氨酸水解酶.pdf
- H3C_S5800_S5820X系列数据中心级万兆交换机.pdf
- H3C_SecPath_F100系列防火墙_安装指导-6PW102-附录.pdf
- H3C_中低端以太网交换机_ACL和QoS典型配置指导-6W100-ACL典型配置指导.pdf
- H3C_ACG应用控制网关主 打胶片.pdf
- H3C_WA2620i-AGN_无线接入点设备_安装指导-6PW102-正文.pdf
- H3Cloud应用案例精选.pdf
- (必看)工_程_预_算_秘_籍.pdf
- H3C_S12510-X核心交换机Network_Test性能测试报告.pdf
最近下载
- 音响灯光系统维保方案.docx VIP
- 第五章——陶瓷基复合材料.ppt VIP
- xxxxxxxxxxx工程创“钱江杯”优质工程情况汇报.docx VIP
- 西华大学电气与电子信息学院课程设计—某农村电网110kV变电所继电保护的配置和整定(3).docx
- xx工程创“钱江杯”优质工程情况汇报.doc
- EN 50124-1-2001铁路设施 — 绝缘配合 — 第 1 部分:基本要求 — 所有电气和电子设备的间隙距离和爬电距离(中文版).doc
- 中国古代的法治与教化 教学设计-【新教材】高中历史统编版(2019)选择性必修1.docx
- (高清版)B-T 3836.1-2021 爆炸性环境 第1部分:设备 通用要求.pdf VIP
- 2022《立体仓库控制系统设计》开题报告.doc VIP
- 2024年银行支部书记党课讲稿集合6篇.docx VIP
文档评论(0)