- 1
- 0
- 约7.67千字
- 约 21页
- 2026-05-07 发布于四川
- 举报
2025年数据建模工程师考试题库(附答案和详细解析)
一、单项选择题(每题2分,共20分)
1.以下哪种数据清洗方法最适用于处理时间序列数据中的随机缺失值?
A.均值填充
B.前向填充(FFill)
C.回归填充
D.删除缺失行
答案:B
解析:时间序列数据具有时序相关性,前向填充(FFill)利用最近的历史值填充缺失,能保留序列的时间依赖性;均值填充会抹平时序特征,回归填充需要额外变量,删除缺失行会损失连续信息,因此选B。
2.计算特征IV(信息价值)时,若某分箱的WOE(证据权重)为-1.2,说明该分箱内:
A.坏样本比例显著高于好样本
B.好样本比例显著高于坏样本
C.好坏样本比例接近
D.无坏样本
答案:A
解析:WOE计算公式为ln(好样本占比/坏样本占比),负值表示好样本占比小于坏样本占比(即坏样本比例更高),因此选A。IV通过WOE衡量特征预测能力,WOE绝对值越大,特征区分度越强。
3.评估二分类模型时,若测试集的AUC为0.85,最可能的解释是:
A.模型在85%的测试样本上分类正确
B.模型将正样本排在负样本前的概率为85%
C.模型的召回率为85%
D.模型的精确率为85%
答案:B
解析:AUC(曲线下面积)反映模型对正样本排序高于负样本的概率,0.8
原创力文档

文档评论(0)