2025年数据建模工程师考试题库(附答案和详细解析).docxVIP

  • 1
  • 0
  • 约7.67千字
  • 约 21页
  • 2026-05-07 发布于四川
  • 举报

2025年数据建模工程师考试题库(附答案和详细解析).docx

2025年数据建模工程师考试题库(附答案和详细解析)

一、单项选择题(每题2分,共20分)

1.以下哪种数据清洗方法最适用于处理时间序列数据中的随机缺失值?

A.均值填充

B.前向填充(FFill)

C.回归填充

D.删除缺失行

答案:B

解析:时间序列数据具有时序相关性,前向填充(FFill)利用最近的历史值填充缺失,能保留序列的时间依赖性;均值填充会抹平时序特征,回归填充需要额外变量,删除缺失行会损失连续信息,因此选B。

2.计算特征IV(信息价值)时,若某分箱的WOE(证据权重)为-1.2,说明该分箱内:

A.坏样本比例显著高于好样本

B.好样本比例显著高于坏样本

C.好坏样本比例接近

D.无坏样本

答案:A

解析:WOE计算公式为ln(好样本占比/坏样本占比),负值表示好样本占比小于坏样本占比(即坏样本比例更高),因此选A。IV通过WOE衡量特征预测能力,WOE绝对值越大,特征区分度越强。

3.评估二分类模型时,若测试集的AUC为0.85,最可能的解释是:

A.模型在85%的测试样本上分类正确

B.模型将正样本排在负样本前的概率为85%

C.模型的召回率为85%

D.模型的精确率为85%

答案:B

解析:AUC(曲线下面积)反映模型对正样本排序高于负样本的概率,0.8

文档评论(0)

1亿VIP精品文档

相关文档