2026年高级数据分析师考试题库(附答案和详细解析)(0414).docxVIP

  • 0
  • 0
  • 约6.13千字
  • 约 10页
  • 2026-05-01 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0414).docx

高级数据分析师考试试卷

总分:100分

一、单项选择题(共10题,每题1分,共10分)

在数据预处理阶段,处理缺失值时最常用的方法是?

A.直接删除含有缺失值的所有记录

B.使用该列的均值进行填充

C.使用该列的中位数进行填充

D.使用该列的众数进行填充

答案:B

解析:正确选项B的依据是,均值填充是处理数值型缺失值的常用方法,因为它能保持数据的整体分布;错误选项A会导致数据量减少和信息损失,C和D虽然适用于不同分布(中位数用于偏态分布,众数用于分类数据),但均值的普适性更高,尤其在对称分布数据中更有效。

在SQL查询中,用于计算表中行数的函数是?

A.SUM()

B.COUNT()

C.AVG()

D.MAX()

答案:B

解析:正确选项B的依据是,COUNT()函数专用于统计行数或非空值数量;错误选项A用于求和,C用于求平均值,D用于求最大值,均不符合计数功能。

在机器学习中,用于解决分类问题的算法是?

A.线性回归

B.K-Means聚类

C.逻辑回归

D.主成分分析

答案:C

解析:正确选项C的依据是,逻辑回归通过概率模型处理分类问题(如二分类);错误选项A用于回归问题,B用于无监督聚类,D用于降维而非分类。

在数据可视化中,最适合展示多个分类变量之间关系的图表类型是?

A.饼图

B.条形图

C.折线图

D.散点图

文档评论(0)

1亿VIP精品文档

相关文档