- 2
- 0
- 约6.05千字
- 约 10页
- 2026-06-18 发布于湖北
- 举报
2026年大数据分析师中级考试押题试卷(含答案)
考试时间:______分钟总分:______分姓名:______
一、选择题(每题只有一个正确选项,请将正确选项字母填入括号内。每题2分,共30分)
1.下列关于HDFS架构的描述中,错误的是:
A.HDFS采用主/从(Master/Slave)架构
B.NameNode负责管理文件系统的元数据
C.DataNode负责存储实际数据块,并执行数据块的读写操作
D.HDFS适合存储小量、结构化的数据
2.MapReduce模型中,Map阶段的输出键值对(Key,Value)在Reduce阶段之前会:
A.直接被所有Reduce任务完全共享
B.只被负责特定Key的Reduce任务获取
C.需要经过Shuffle和Sort过程
D.被随机分配给任何一个Reduce任务
3.以下哪个组件是SparkCore的核心抽象,代表了不可变、分区的数据集?
A.DataFrame
B.Dataset
C.RDD
D.SparkSession
4.在SparkSQL中,如果你希望利用Spark的优化器对查询进行处理,应该使用哪种DataFrame操作?
A.collect()
原创力文档

文档评论(0)