大数据工程师面试题及Hadop_Spark技术含答案.docxVIP

  • 2
  • 0
  • 约5.08千字
  • 约 14页
  • 2026-03-18 发布于福建
  • 举报

大数据工程师面试题及Hadop_Spark技术含答案.docx

第PAGE页共NUMPAGES页

2026年大数据工程师面试题及HadopSpark技术含答案

一、单选题(每题2分,共10题)

1.在Hadoop生态系统中,以下哪个组件主要负责分布式文件存储?

A.HDFS

B.YARN

C.Hive

D.HBase

2.Spark中,RDD的“惰性计算”特性主要得益于什么?

A.优化的内存管理

B.代码编译优化

C.缓存中间结果

D.DAG(有向无环图)优化

3.以下哪种数据格式在Spark中支持列式存储,且适合SQL查询?

A.JSON

B.Parquet

C.Avro

D.ORC

4.在Hadoop集群中,NameNode的内存不足可能导致什么问题?

A.数据丢失

B.无法启动DataNode

C.无法新增块(Block)

D.SecondaryNameNode失效

5.SparkSQL中,以下哪个函数用于将字符串转换为日期格式?

A.to_timestamp

B.to_date

C.cast

D.substring

6.在HadoopMapReduce中,Reduce阶段的输入数据来自?

A.Map阶段的输出

B.HDFS文件

C.HBase表

D.YARN资源管理

7.SparkSession的默认执行模式是什么?

A.Standalone

B.Lo

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档