2026年数据建模工程师考试题库(附答案和详细解析)(0206).docxVIP

  • 0
  • 0
  • 约7.41千字
  • 约 10页
  • 2026-04-26 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0206).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

数据预处理中,处理数值型特征缺失值时最不推荐的方法是?

A.用特征中位数填充

B.删除所有含缺失值的行

C.用特征均值填充

D.用相邻值插值填充

答案:B

解析:删除所有含缺失值的行可能导致大量数据丢失(尤其当缺失率较高时),严重降低数据利用效率;其他选项均为合理的缺失值处理方法(中位数/均值适用于数值型,插值适用于时序数据)。

评估正负样本极不平衡的分类模型时,最不适合的指标是?

A.F1-score

B.准确率(Accuracy)

C.AUC-ROC

D.召回率(Recall)

答案:B

解析:准确率在样本不平衡时会被多数类主导(如99%负样本时,全预测负样本准确率可达99%),无法反映模型对少数类的识别能力;其他指标(F1、AUC-ROC、召回率)均能更合理评估不平衡场景。

逻辑回归中使用L2正则化的主要目的是?

A.提高模型泛化能力

B.减少计算复杂度

C.解决类别不平衡

D.处理特征多重共线性

答案:A

解析:L2正则化通过惩罚大的权重系数,限制模型复杂度,防止过拟合,从而提升泛化能力;减少计算复杂度(与模型结构相关)、解决类别不平衡(需调整样本权重)、处理多重共线性(需特征筛选)均非L2正则化的核心目标。

随机森林中的“随机”不体现在以下哪项?

A.随机选择样本子集(Boo

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档