- 0
- 0
- 约6.06千字
- 约 11页
- 2021-11-13 发布于湖南
- 举报
如何高效的做到全栈数据工程师系列(下)
数据仓库与Python大数据
2021-09-03
以下文章来源于憋七工作室 ,作者憋七 HYPERLINK
憋七工作室
.
只聊那些有的没的
导读:如何高效的做到全栈数据工程师,本文从面试的视角开放次要分为以下篇章:
Hadoop原理篇
MySQL 进阶篇
数据结构算法篇
? 关注 『数据仓库与Python大数据』,猎取更多 优质资源与干货文章。
作者:?憋七
编辑:?紫霞仙子
注释
一、Hadoop原理篇
就是HDFS+Yarn+MapReduce
HDFS分布式文件存储
? ? ? 一个NameNode+N个DataNode,2.0Hadoop和1.0的区分在于可以配置两个NameNode,也就是NameNode的HA,一个是Active形态,另一个是Standby形态,实质还是保持一个NameNode在工作
HDFS的操作,分为写和读,记住读和写的流程即可
写操作:
Client发起写操作告知NameNode
NameNode依据文件大小和块配置,前往给Client它下面管理的DataNode的信息
Client再依据块大小,划分多个块,再找到DataNode的信息,再写入DataNode块中
读操作:
Client发起读操作告知NameNode
NameNode前往Client块信息以及对应的Data
您可能关注的文档
最近下载
- DBJ33T1038-2024 生态河道建设技术标准.pdf VIP
- 注塑成型-注塑成型工艺.ppt VIP
- HCIA-Datacom V1.0 数据通信培训教材.pdf VIP
- 热量传递的三种方式 - 热量传递的三种方式.ppt VIP
- 《机械制造技术》课程设计工序卡片牛头刨床进给机构中推动架的机械加工工艺规程的设计.pdf VIP
- 公路沥青路面施工技术规范 最新版.docx VIP
- 2022上海十六区高三英语二模汇编 —作文(答案解析版).docx VIP
- 宣贯培训(2026年)《GBT 18802.21-2016低压电涌保护器 第21部分:电信和信号网络的电涌保护器(SPD) 性能要求和试验方法》.pptx VIP
- 2024电压暂降监测系统技术规范.pdf
- 医学病例书写规范.pptx VIP
原创力文档

文档评论(0)