- 0
- 0
- 约3.13千字
- 约 9页
- 2026-03-20 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析师面试题及数据分析方法论含答案
一、选择题(共5题,每题2分)
1.在处理缺失值时,以下哪种方法最适用于数据量较大且缺失比例不高的情况?
A.删除含有缺失值的样本
B.填充均值或中位数
C.使用模型预测缺失值
D.忽略缺失值直接分析
答案:B
解析:对于数据量较大且缺失比例不高的情况,填充均值或中位数能保持数据分布的稳定性,且计算效率高。删除样本会导致数据损失,模型预测缺失值复杂度高,忽略缺失值则可能引入偏差。
2.以下哪个指标最适合衡量分类模型的预测准确性?
A.召回率(Recall)
B.精确率(Precision)
C.F1分数(F1-Score)
D.AUC值
答案:C
解析:F1分数是精确率和召回率的调和平均值,适用于类别不平衡场景。召回率侧重查全率,精确率侧重查准率,AUC衡量模型排序能力,F1分数更综合。
3.在进行用户分群时,以下哪种算法不属于无监督学习?
A.K-Means聚类
B.层次聚类
C.Apriori关联规则挖掘
D.DBSCAN聚类
答案:C
解析:Apriori用于关联规则挖掘,属于频繁项集算法,不属于聚类算法。K-Means、层次聚类和DBSCAN均是无监督聚类算法。
4.以下哪个是时间序列分析中常用的平滑方法?
A.线性回归
B.ARIMA模型
原创力文档

文档评论(0)