2026年高级数据分析师考试题库(附答案和详细解析)(0413).docxVIP

  • 3
  • 0
  • 约6.03千字
  • 约 9页
  • 2026-05-01 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0413).docx

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据清洗中,处理数值型缺失值的最常用方法是什么?

A.直接删除包含缺失值的行

B.用该变量的平均值填充

C.用该变量的中位数填充

D.用该变量的众数填充

答案:B

解析:正确选项的依据是,平均值填充是处理数值型缺失值的标准方法,因为它能保持数据的中心趋势,尤其适用于正态分布数据(知识点:数据预处理)。错误选项的问题:A可能导致数据损失过大;C适用于偏态分布,但非最常用;D适用于分类数据,不适用于数值型数据。

在机器学习中,以下哪个算法属于监督学习?

A.K-means聚类

B.决策树

C.主成分分析(PCA)

D.Apriori算法

答案:B

解析:正确选项的依据是,决策树需要标签数据训练,属于监督学习(知识点:机器学习分类)。错误选项的问题:A、C和D均为无监督学习算法,无需标签数据。

在SQL查询中,用于从表中筛选唯一值的子句是什么?

A.GROUPBY

B.DISTINCT

C.HAVING

D.WHERE

答案:B

解析:正确选项的依据是,DISTINCT关键字用于返回唯一值(知识点:SQL基础)。错误选项的问题:A用于分组聚合;C用于过滤分组结果;D用于过滤行,但不保证唯一性。

在数据可视化中,箱线图(BoxPlot)主要用于展示什么?

A.变量间的相关性

B.数据分

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档