2026年高级数据分析师考试题库(附答案和详细解析)(0221).docxVIP

  • 0
  • 0
  • 约8.17千字
  • 约 12页
  • 2026-03-23 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0221).docx

高级数据分析师考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

以下哪项是处理高维数据中类别特征的最佳实践?

A.直接删除类别特征

B.对类别特征进行标准化(Z-score)

C.使用独热编码(One-HotEncoding)

D.用均值填充缺失的类别值

答案:C

解析:类别特征(如“性别”“地区”)是离散非数值型数据,标准化(B)仅适用于连续型数据;直接删除(A)会丢失信息;均值填充(D)无意义。独热编码(C)通过二进制向量表示类别,是处理类别特征的标准方法。

在A/B测试中,确保实验结果有效的核心条件是?

A.实验组样本量是对照组的2倍

B.流量分配满足“互斥且均匀”

C.显著性水平设定为0.01

D.仅分析均值指标的变化

答案:B

解析:A/B测试的核心是随机分组,确保实验组与对照组的用户特征无显著差异(互斥且均匀)。样本量需通过统计功效计算(A错误);显著性水平(如0.05)是统计标准,非核心(C错误);需分析多维度指标(D错误)。

以下哪种场景最适合使用逻辑回归模型?

A.预测用户未来3个月的消费金额(连续值)

B.识别垃圾邮件(二分类问题)

C.对用户行为数据进行聚类分组

D.预测商品销量的季节性波动

答案:B

解析:逻辑回归是经典的二分类模型(B正确)。预测连续值(A)需线性回归;聚类(C)用K-means等;季节性预

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档