2026年数据分析师建模能力题库.docxVIP

  • 1
  • 0
  • 约3.48千字
  • 约 9页
  • 2026-05-13 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据分析师建模能力题库

一、选择题(每题2分,共10题)

1.在构建客户流失预测模型时,以下哪种特征工程方法最适合处理缺失值?

A.均值填充

B.回归插补

C.KNN填充

D.删除缺失值

2.对于金融风控场景,逻辑回归模型相比随机森林模型的优点是什么?

A.更易处理高维数据

B.具有更好的鲁棒性

C.可解释性更强

D.预测速度更快

3.在时间序列预测中,ARIMA模型的适用条件是什么?

A.数据需平稳

B.数据需非平稳

C.数据需正态分布

D.数据需线性关系

4.在电商用户行为分析中,如何衡量用户活跃度?

A.购买频率

B.浏览时长

C.页面跳出率

D.以上都是

5.在异常检测中,孤立森林算法的核心思想是什么?

A.密度聚类

B.基于树的结构隔离异常点

C.基于距离的度量

D.基于统计检验

二、填空题(每题3分,共5题)

6.在特征选择中,Lasso回归通过__________惩罚实现特征稀疏化。

(答案:L1正则化)

7.在A/B测试中,若P值小于0.05,通常认为__________具有统计显著性。

(答案:实验组效果优于对照组)

8.在梯度提升树(GBDT)中,__________是控制模型复杂度的超参数。

(答案:树的最大深度)

9.在协同过滤推荐系统中,__

文档评论(0)

1亿VIP精品文档

相关文档