2026年高级数据分析师考试题库(附答案和详细解析)(0501).docxVIP

  • 1
  • 0
  • 约6.76千字
  • 约 9页
  • 2026-05-10 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0501).docx

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

1.在数据预处理中,缺失值处理时,哪种方法可能导致数据偏差增大?

A.使用均值填充连续型变量

B.使用众数填充分类变量

C.直接删除包含缺失值的记录

D.使用插值法(如线性插值)

答案:C

解析:正确选项C的依据是,直接删除记录可能丢失重要信息,导致样本偏差(如删除特定群体数据),不符合数据完整性原则。错误选项A(均值填充适用于连续变量,偏差较小)、B(众数填充适用于分类变量,相对合理)和D(插值法能保留数据趋势)均属于标准处理方式,但C在数据量少时风险最大。

在假设检验中,当p值小于显著性水平α时,应如何决策?

A.拒绝原假设

B.接受原假设

C.增加样本量重新检验

D.无法得出结论

答案:A

解析:正确选项A的依据是,p值小于α(如0.05)表示有足够证据拒绝原假设(如无差异)。错误选项B(接受原假设需p值大于α)、C(样本量问题不影响决策逻辑)和D(p值可直接用于决策)均违背假设检验基本原理。

在机器学习中,以下哪种算法属于无监督学习?

A.逻辑回归

B.支持向量机(SVM)

C.K-means聚类

D.决策树

答案:C

解析:正确选项C的依据是,K-means聚类无需标签数据,用于发现数据内在结构。错误选项A、B和D均属于监督学习算法(需标签数据训练),如逻辑回归用于分类、SV

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档