2025最新大数据分析师数据清洗试题及答案.docVIP

  • 2
  • 0
  • 约3.32千字
  • 约 13页
  • 2026-06-26 发布于江苏
  • 举报

2025最新大数据分析师数据清洗试题及答案.doc

2025最新大数据分析师数据清洗试题及答案

一、单项选择题(总共10题,每题2分)

1.在数据清洗过程中,以下哪一项不属于数据预处理的主要步骤?

A.数据格式化

B.数据集成

C.数据变换

D.数据挖掘

答案:D

2.当处理缺失值时,以下哪种方法通常适用于连续型数据?

A.删除含有缺失值的记录

B.使用平均值填充

C.使用众数填充

D.使用分类算法预测

答案:B

3.在数据清洗中,以下哪一项不是异常值检测的方法?

A.箱线图法

B.Z分数法

C.空间聚类法

D.相关性分析法

答案:D

4.数据标准化和归一化的主要区别在于?

A.标准化使用均值和标准差,归一化使用最小值和最大值

B.标准化适用于分类数据,归一化适用于数值数据

C.标准化不改变数据的分布,归一化会改变数据的分布

D.标准化适用于小数据集,归一化适用于大数据集

答案:A

5.在处理重复数据时,以下哪一项是正确的做法?

A.保留所有重复数据

B.删除所有重复数据

C.只删除部分重复数据

D.标记重复数据但不删除

答案:B

6.数据清洗中,以下哪一项不是数据一致性的问题?

A.数据类型不一致

B.数据格式不一致

C.数据值域不一致

D.数据采集方法不一致

答案:D

7.在数据清洗过程中,以下哪一项是数据验证的主要目的?

A.提高数据质量

B.减少数据量

C

文档评论(0)

1亿VIP精品文档

相关文档