- 24
- 0
- 约4.81万字
- 约 39页
- 2020-12-29 发布于广东
- 举报
更多课程请加QQ484683840
大数据面试题
更多课程请加QQ484683840
目录
hadoop 面试题
1.讲述HDFS 上传文件和读文件的流程 2
2.HDFS 在上传文件的时候,如果其中一个块突然损坏了怎么办? 2
3.NameNode 的作用 2
4.NameNode 在启动的时候会做哪些操作 2
5.NameNode 的HA 3
6.Hadoop 的作业提交流程 4
7.Hadoop 怎么分片 4
8.如何减少Hadoop Map 端到Reduce 端的数据传输量 4
9.Hadoop 的Shuffle? 4
10.哪些场景才能使用Combiner 呢? 5
11.HMaster 的作用 5
12.如何实现hadoop 的安全机制 5
13.hadoop 的调度策略的实现,你们使用的是那种策略,为什么。 5
14.数据倾斜怎么处理? 6
15.评述hadoop 运行原理 6
16.简答说一下hadoop 的map-reduce 编程模型 6
17.hadoop 的TextInputFormat 作用是什么,如何自定义实现 6
18.map-reduce 程序运行的时候会有什么比较常见的问题 7
19.Hadoop 平台集群配置、环境变量设置? 7
20.Hadoop 性能调优? 7
21.Hadoop 高并发? 8
Hive 面试题
1. hadoop 中两个大表实现join 的操作,简单描述。 2
2.Hive 中存放是什么? 2
3.Hive 与关系型数据库的关系? 2
4.讲一下数据库,SQl ,左外连接, 原理,实现? 2
5.大表和小表join 2
6. 数据清洗怎么做的?怎么用spark 做数据清洗 2
7. Hadoop 中二次排序怎么做? 2
8. hadoop 常见的join 操作? 3
9. hive 优化有哪些? 3
10. 分析函数? 3
Spark 面试题
1.Spark 的Shuffle 原理及调优 2
2.hadoop 和spark 使用场景? 4
3.spark 如何保证宕机迅速恢复? 5
4.hadoop 和spark 的相同点和不同点? 5
5.RDD 持久化原理? 5
6.checkpoint 检查点机制? 6
更多课程请加QQ484683840
7.checkpoint 和持久化机制的区别? 6
8.Spark Streaming 和Storm 有何区别? 6
9.RDD 机制? 7
10.Spark streaming 以及基本工作原理? 7
11.DStream 以及基本工作原理? 7
12.spark 有哪些组件? 7
13.spark 工作机制? 8
14.Spark 工作的一个流程? 8
15.spark 核心编程原理? 8
16.spark 基本工作原理? 8
17.spark 性能优化有哪些? 8
18.updateStateByKey 12
19.宽依赖和窄依赖 12
20.spark streaming 中有状态转化操作? 12
21.spark 常用的计算框架? 13
22.spark 整体架构? 14
23.Spark 的特点是什么? 14
24.搭建spark 集群步骤? 14
25.Spark 的三种提交模式是什么? 15
26..spark 内核架构原理 15
27.Spark yarn-cluster 架构? 15
28.Spark yarn-client 架构? 16
29.SparkContext 初始化原理? 16
30.Spark 主备切换机制原理剖析? 16
31.spark 支持故障恢复的方式? 16
32.spark 解决了hadoop 的哪些问题? 17
33.数据倾斜的产生和解决办法? 17
34.spark 实现高可用性:High Availability 17
35.spark 实际工作中,是怎么来根据任务量,判定需要多少资源的? 19
更
您可能关注的文档
- 让学习更科学更快乐更有效---学习科学和游戏化学习视野下的未来教育---60分钟--河南教育技术协会年会--20201126b.pdf
- 未来教育如何重塑:互联网+促教育流程再造---30分钟版--2020数字马院联盟会议---20201219.pdf
- 《创新工程实践》游戏化创新设计思维---尚俊杰 - 20201021.pdf
- 让学习更科学更快乐更有效---学习科学和游戏化学习视野下的未来教育---30分钟--20200618--无锡教科院会议.pdf
- 人工智能与教育变革:前景、困难及发展策略---60分钟--河南师范大学--20200705.pdf
- 让学习更科学更快乐更有效---学习科学和游戏化学习视野下的未来教育--教育游戏专委会年会-30分钟--20201112.pdf
- 如何科学有效地开展在线教育---中央电教馆---20200402b.pdf
- 让学习更科学更快乐更有效---学习科学和游戏化学习视野下的未来教育---人大附中西山学校1对1峰会--20201213.pdf
- 人工智能教育发展趋势---30分钟--第三届人工智能论坛(雄安)--20200611.pdf
- 人工智能与教育变革:前景、困难及发展策略---30分钟--2020智能教育技术专委会年会---20201111.pdf
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
最近下载
- 准噶尔盆地南缘山前带石油地质综合评价.pdf VIP
- 2012届松江区高三英语二模试卷.doc VIP
- 2012奉贤区高三二模英语含答案.doc VIP
- 云南大学博士、硕士研究生学位论文写作规范-2025.docx VIP
- 2008学年奉贤区调研测试高三英语试卷及答案.doc VIP
- 最新人教版六年级上册数学1-8单元单元测试卷及期中期末卷(含答案).pdf VIP
- [黄浦区2009学年度第一学期期终基础学业测评高三英语附答案.doc VIP
- 2025至2030中国C反应蛋白(CRP)试验行业产业运行态势及投资规划深度研究报告.docx
- 2009学年奉贤区调研测试高三英语试卷(附答案).doc VIP
- 噬神者:爆裂 怪物素材获取方法.pdf VIP
原创力文档

文档评论(0)