- 1
- 0
- 约2.52千字
- 约 8页
- 2026-03-19 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年大数据工程师HadopSpark面试题及答案
一、单选题(每题2分,共10题)
1.在Hadoop生态系统中,HDFS的主要设计目标不包括以下哪项?
A.高容错性
B.高吞吐量
C.低延迟访问
D.数据本地化优先
答案:C
2.Spark中,以下哪种shuffle操作会导致数据在网络中传输量最小?
A.GroupBy
B.ReduceByKey
C.SortBy
D.Join
答案:B
3.HadoopYARN的资源管理模型中,ResourceManager主要负责什么?
A.管理应用程序的运行
B.管理节点上的资源
C.分配容器资源
D.监控应用程序状态
答案:B
4.SparkSQL中,以下哪个函数用于生成随机数?
A.rand()
B.random()
C.sample()
D.uniform()
答案:A
5.在Hadoop中,NameNode的内存主要用于存储什么?
A.数据块位置信息
B.文件系统元数据
C.用户权限信息
D.应用程序日志
答案:B
二、多选题(每题3分,共5题)
6.HadoopMapReduce编程模型中,Mapper阶段的输出格式通常包括哪些?
A.Key-Value对
B.行式数据
C.列式数据
D.二进制数据
答案:
原创力文档

文档评论(0)