2026年大数据分析师专业素质测评试题及答案.docxVIP

  • 0
  • 0
  • 约7.15千字
  • 约 18页
  • 2026-03-27 发布于四川
  • 举报

2026年大数据分析师专业素质测评试题及答案.docx

2026年大数据分析师专业素质测评试题及答案

一、单项选择题(每题2分,共20题,总分40分)

1.以下哪项不属于大数据的“5V”特征?

A.Volume(大量)

B.Velocity(高速)

C.Value(价值)

D.Variation(变异)

2.在数据清洗过程中,处理“年龄”字段中出现“5”的异常值时,最合理的操作是?

A.直接删除该记录

B.用字段均值填充

C.标记为缺失值后按业务规则修正

D.保留原始值不处理

3.以下哪种算法属于无监督学习?

A.逻辑回归

B.Kmeans聚类

C.随机森林

D.支持向量机(SVM)

4.Hadoop生态中,负责分布式数据存储的核心组件是?

A.MapReduce

B.HBase

C.HDFS

D.YARN

5.计算两个变量X和Y的皮尔逊相关系数时,若结果为0.85,说明两者的线性关系是?

A.高度正相关

B.高度负相关

C.无相关

D.中度正相关

6.以下哪种数据存储格式更适合大数据分析中的快速查询?

A.CSV

B.JSON

C.Parquet

D.TXT

7.在Spark中,RDD(弹性分布式数据集)的主要特性是?

A.不可变且可分区

B.

文档评论(0)

1亿VIP精品文档

相关文档