- 1
- 0
- 约4.9千字
- 约 12页
- 2026-05-09 发布于四川
- 举报
2025年大数据试题与答案
一、单项选择题(每题2分,共20分)
1.关于HadoopHDFS的存储机制,以下描述错误的是:
A.数据块默认大小为128MB(Hadoop3.x版本)
B.副本数可通过dfs.replication参数调整,默认3个
C.NameNode元数据存储在内存中,同时持久化到FsImage和EditLog
D.DataNode通过心跳机制向NameNode汇报块信息,超时未汇报则数据块被标记为不可用
2.以下哪项不是SparkRDD的特性?
A.不可变性(Immutable)
B.血统(Lineage)记录
C.自动容错
D.直接存储结构化数据
3.在Kafka中,若要提高消费者组的消息处理吞吐量,最有效的方法是:
A.增加主题的分区数
B.提高生产者的发送速率
C.增大消费者的fetch.min.bytes参数
D.减少消费者组中的消费者数量
4.关于数据湖(DataLake)与数据仓库(DataWarehouse)的区别,正确的是:
A.数据湖存储结构化数据,数据仓库存储非结构化数据
B.数据湖通常在分析前进行清洗(Schema-on-Write),数据仓库在分析时处理(Schema-on-Read)
C.数据湖支持多类型数据存储(如文本
您可能关注的文档
最近下载
- 2025年急性上消化道出血诊疗指南 .pdf VIP
- 2024年最新初级保安员考试题库与参考答案.pdf VIP
- 免费vc中国象棋软件(一).doc VIP
- 2025至2030中国饮料容器涂料行业细分市场及应用领域与趋势展望研究报告.docx VIP
- 2024年保安员上岗证初级保安员考试题库.docx VIP
- 第八届中国淄博国际陶瓷博览会体彩绘.ppt VIP
- 2025最新初级保安员考试题库与参考答案.docx VIP
- 沪教版四年级上学期期末考试语文试卷(共5套,含参考答案).docx VIP
- 沪教版四年级下册语文期中考试试卷(共5套,含答案).docx VIP
- JDY-31-V1.3蓝牙SPP串口透传模块手册.pdf VIP
原创力文档

文档评论(0)