2025年大数据类试题和答案.docx

2025年大数据类试题和答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据清洗的主要目的?

A.去除重复数据

B.填充缺失值

C.减少数据存储量

D.纠正数据中的错误格式

答案:C

2.HDFS默认的块大小在2025年主流配置中通常为?

A.32MB

B.64MB

C.128MB

D.256MB

答案:D(注:随硬件发展,2025年HDFS块大小普遍提升至256MB以降低元数据管理开销)

3.关于SparkRDD的特性,以下描述错误的是?

A.不可变性(Immutable)

B.自动容错(Faul

文档评论(0)

1亿VIP精品文档

相关文档