2026年数据建模工程师考试题库(附答案和详细解析)(0311).docxVIP

  • 1
  • 0
  • 约8.93千字
  • 约 12页
  • 2026-03-18 发布于江苏
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0311).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据预处理中,处理缺失值的最佳策略是()

A.直接删除所有含缺失值的样本

B.统一用均值填充数值型特征

C.根据业务场景选择填充方法(如中位数、众数、模型预测)

D.忽略缺失值,直接输入模型

答案:C

解析:缺失值处理需结合具体业务场景:删除样本可能导致数据丢失(A错误);均值易受异常值影响,并非所有数值型特征都适用(B错误);忽略缺失值会导致模型报错(D错误);正确方法是根据特征分布、业务含义选择填充方式(如年龄用中位数,类别特征用众数,重要特征用模型预测)(C正确)。

以下哪种指标最适合评估二分类模型的“区分正例和负例的能力”?()

A.准确率(Accuracy)

B.F1分数

C.AUC-ROC

D.均方误差(MSE)

答案:C

解析:准确率在类别不平衡时易误导(A错误);F1分数关注精确率与召回率的平衡(B错误);AUC-ROC反映模型在不同阈值下的整体分类能力(C正确);MSE用于回归问题(D错误)。

防止模型过拟合的常用方法是()

A.增加模型复杂度(如加深神经网络层数)

B.减少训练数据量

C.添加L2正则化项

D.移除所有特征选择步骤

答案:C

解析:增加复杂度会加剧过拟合(A错误);减少数据量会降低模型泛化能力(B错误);L2正则化通过约束参数大小抑制过拟合(C

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档