- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HDFS HA和Federation实践
天云趋势
孙振南 张军 钱兴会
议程
为什么需要HA和Federation
Hadoop 2.0中HA和Federation的实现方式
HA和Federation配置
HA测试方案和结果
HA推荐配置
未尽事宜
附:趋势科技如何使用Hadoop
为什么需要HA和Federation
NameNode 单点故障
Secondary NN不是HA,SNN甚至无法保证数据完整性
Backup NN (HADOOP-4539)也一样不安全,但略有一点Warm Standby
手动把name.dir/edits.dir指向NFS 是安全的Cold Standby
Facebook AvatarNode是Hot Standby,但只有手动切换
还有若干解决方案,基本都是依赖外部的HA机制
NameNode内存限制了文件数目和集群的存储容量
1G ≈ 1M block ≈ 64T
NameNode的性能瓶颈
Client: addBlock, getBlockLocations
DataNode: blockRecieved, sendHeartbeat, blockReport
Hadoop 2.0里HA的实现方式
来源: HDFS-1623 设计文档
作者: Sanjay
Radia, Suresh
Srinivas
HA设计上的考虑
共享存储
不再是share nothing,转移了单点故障的位置
利用NFS的close-to-open来保证一致性
未来可能替换为BookKeeper
FailOverController
独立的,短小精悍的watchdog
避免NN GC时的心跳暂停
可替换为其他的HA方案或leader选举方案,目前是ZKFC
Fencing
防止脑裂
只能有一个NN响应请求,下发命令,写入edits
客户端fencing, DataNode fencing, 共享存储fencing
Hadoop 2.0里Federation的实现方式
来源: HDFS-1052 设计文档
作者: Sanjay
Radia, Suresh
Srinivas
Federation设计上的考虑
改动最小,向前兼容
现有的NN无需任何配置改动
如果客户端只连某台NN的话,配置也无需改动
分离命名空间管理和块存储管理
提供良好扩展性的同时允许其他文件系统或应用直接使用块存储池
统一的块存储管理保证了资源利用率
可以只通过防火墙配置达到一定的文件访问隔离
客户端挂载表
通过路径自动对应NN
使Federation对现有应用完全透明
测试环境
DN-1
DN-2
DN-3
DN-4
DN-5
DN-6
NN-1
NN-3
NN-2
NN-4
Storage Pool 1
Storage Pool 2
Name Service 1
/share/
Name Service 2
/user/
Client Side Mount Table
HA
HA
Federation
HA配置: 所有节点
core-site.xml
fs.defaultFS
逻辑名称,替代之前的
hdfs://ns1
hdfs-site.xml
services
逻辑名称,与core-site里的对应
nodes.${NS_ID}
列出该逻辑名称下的NameNode逻辑名称
nn1,nn3
node.${NS_ID}.${NN_ID}
指定NameNode的RPC位置
nodes.ns1.nn1=host-nn1:9000
nodes.ns1.nn3=host-nn3:9000
node.http-address.${NS_ID}.${NN_ID}
指定NameNode的Web位置,50070
HA配置: NameNode和客户端
NameNode: hdfs-site.xml
node.shared.edits.dir
指定NFS挂载点,HA共享存储
file:///nfs-host/hdfsha
ha.zookeeper.quorum
host-zk:2181
ha.zookeeper.session-timeout.ms
单位毫秒
dfs.ha.fencing.methods
sshfence, shell()
客户端: hdfs-site.xml
dfs.ha.automatic-failover.enabled
true/false
vider.${NS_ID}
客户端用于自动切换的代理类
node.ha.ConfiguredFailoverProxyProvider
Federation配置: 所有节点
core-site.xml
xi:include href=“cmt.xml/
fs.defaultFS
逻辑名称
您可能关注的文档
- 琴键上字符 研究性学习.doc
- 禽流感发生对家禽养殖农户经济影响评估_基于两期面板数据分析_于乐荣.pdf
- EMC标准及规范.ppt
- 清洗咖啡污渍方法.doc
- Excel中数据的查找、替换及排序.ppt
- 球形颗粒随机排列过程计算机模拟.pdf
- excle在财务管理中的应用第1篇.ppt
- FASB及IASB联合趋同框架初步意见的评介.pdf
- Fe_3O_4_MWCNTs在环氧树脂中定向排列_陈伟.pdf
- 确信及限制_国家所有权主体的法哲学思考.pdf
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
最近下载
- 百日咳试题附有答案.docx VIP
- 2024年广东省深圳市光明区人大常委会办公室招聘一般类岗位专干12人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- 高中语文任务驱动型材料作文:枯燥与热闹审题指导(含解析).docx VIP
- 某镇卫生院污水设计方案.pdf VIP
- 2024年广东深圳市光明区人大常委会办公室招聘一般类岗位专干3人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- 中考数学经验交流会发言稿.pdf
- 2024年7月广东省深圳市光明区人大常委会办公室招聘10人历年【高频考点汇总500题】模拟卷及参考答案详解.docx VIP
- 《溜冰圆舞曲和雷鸣电闪波尔卡》精品课件2023.pptx
- 水利项目安全评价报告.docx
- 2024年7月广东省深圳市光明区人大常委会办公室招聘10人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
文档评论(0)