2026年数据建模工程师考试题库（附答案和详细解析）（0311）.docxVIP

2026年数据建模工程师考试题库（附答案和详细解析）（0311）.docx

数据建模工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

在数据预处理中，处理缺失值的最佳策略是（）

A.直接删除所有含缺失值的样本

B.统一用均值填充数值型特征

C.根据业务场景选择填充方法（如中位数、众数、模型预测）

D.忽略缺失值，直接输入模型

答案：C

解析：缺失值处理需结合具体业务场景：删除样本可能导致数据丢失（A错误）；均值易受异常值影响，并非所有数值型特征都适用（B错误）；忽略缺失值会导致模型报错（D错误）；正确方法是根据特征分布、业务含义选择填充方式（如年龄用中位数，类别特征用众数，重要特征用模型预测）（C正确）。

以下哪种指标最适合评估二分类模型的“区分正例和负例的能力”？（）

A.准确率（Accuracy）

B.F1分数

C.AUC-ROC

D.均方误差（MSE）

答案：C

解析：准确率在类别不平衡时易误导（A错误）；F1分数关注精确率与召回率的平衡（B错误）；AUC-ROC反映模型在不同阈值下的整体分类能力（C正确）；MSE用于回归问题（D错误）。

防止模型过拟合的常用方法是（）

A.增加模型复杂度（如加深神经网络层数）

B.减少训练数据量

C.添加L2正则化项

D.移除所有特征选择步骤

答案：C

解析：增加复杂度会加剧过拟合（A错误）；减少数据量会降低模型泛化能力（B错误）；L2正则化通过约束参数大小抑制过拟合（C

更多 >