2026年数据建模工程师考试题库（附答案和详细解析）（0206）.docxVIP

2026年数据建模工程师考试题库（附答案和详细解析）（0206）.docx

数据建模工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

数据预处理中，处理数值型特征缺失值时最不推荐的方法是？

A.用特征中位数填充

B.删除所有含缺失值的行

C.用特征均值填充

D.用相邻值插值填充

答案：B

解析：删除所有含缺失值的行可能导致大量数据丢失（尤其当缺失率较高时），严重降低数据利用效率；其他选项均为合理的缺失值处理方法（中位数/均值适用于数值型，插值适用于时序数据）。

评估正负样本极不平衡的分类模型时，最不适合的指标是？

A.F1-score

B.准确率（Accuracy）

C.AUC-ROC

D.召回率（Recall）

答案：B

解析：准确率在样本不平衡时会被多数类主导（如99%负样本时，全预测负样本准确率可达99%），无法反映模型对少数类的识别能力；其他指标（F1、AUC-ROC、召回率）均能更合理评估不平衡场景。

逻辑回归中使用L2正则化的主要目的是？

A.提高模型泛化能力

B.减少计算复杂度

C.解决类别不平衡

D.处理特征多重共线性

答案：A

解析：L2正则化通过惩罚大的权重系数，限制模型复杂度，防止过拟合，从而提升泛化能力；减少计算复杂度（与模型结构相关）、解决类别不平衡（需调整样本权重）、处理多重共线性（需特征筛选）均非L2正则化的核心目标。

随机森林中的“随机”不体现在以下哪项？

A.随机选择样本子集（Boo

更多 >