2025年大数据试题与答案.docxVIP

  • 1
  • 0
  • 约4.9千字
  • 约 12页
  • 2026-05-09 发布于四川
  • 举报

2025年大数据试题与答案

一、单项选择题(每题2分,共20分)

1.关于HadoopHDFS的存储机制,以下描述错误的是:

A.数据块默认大小为128MB(Hadoop3.x版本)

B.副本数可通过dfs.replication参数调整,默认3个

C.NameNode元数据存储在内存中,同时持久化到FsImage和EditLog

D.DataNode通过心跳机制向NameNode汇报块信息,超时未汇报则数据块被标记为不可用

2.以下哪项不是SparkRDD的特性?

A.不可变性(Immutable)

B.血统(Lineage)记录

C.自动容错

D.直接存储结构化数据

3.在Kafka中,若要提高消费者组的消息处理吞吐量,最有效的方法是:

A.增加主题的分区数

B.提高生产者的发送速率

C.增大消费者的fetch.min.bytes参数

D.减少消费者组中的消费者数量

4.关于数据湖(DataLake)与数据仓库(DataWarehouse)的区别,正确的是:

A.数据湖存储结构化数据,数据仓库存储非结构化数据

B.数据湖通常在分析前进行清洗(Schema-on-Write),数据仓库在分析时处理(Schema-on-Read)

C.数据湖支持多类型数据存储(如文本

文档评论(0)

1亿VIP精品文档

相关文档