2026年数据建模工程师考试题库(附答案和详细解析)(0120).docxVIP

  • 0
  • 0
  • 约7.92千字
  • 约 11页
  • 2026-03-07 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0120).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种数据预处理方法最适用于处理偏态分布的数值型特征的缺失值?

A.用均值填充

B.用中位数填充

C.用众数填充

D.直接删除缺失行

答案:B

解析:偏态分布数据中,均值易受极端值影响,不能代表数据集中趋势;众数适用于分类型数据;直接删除会损失信息。中位数对极端值不敏感,能更好反映偏态分布的集中趋势,因此选B。

逻辑回归模型的损失函数通常是?

A.均方误差(MSE)

B.交叉熵损失(Cross-Entropy)

C.绝对误差(MAE)

D.Huber损失

答案:B

解析:逻辑回归用于分类任务,目标是最小化预测概率与真实标签的差异,交叉熵损失直接衡量概率分布的不一致性,是分类任务的常用损失函数。MSE和MAE用于回归任务,Huber损失是MSE和MAE的折中,均不适用于逻辑回归。

以下哪项不是随机森林(RandomForest)的特性?

A.基于多个决策树的集成

B.对特征重要性可量化

C.容易因过深树导致过拟合

D.支持并行训练

答案:C

解析:随机森林通过Bagging(自助采样)和特征随机选择,降低了单棵树的方差,整体模型不易过拟合。其他选项均为随机森林的典型特性。

在分类任务中,若正负样本比例为1:100,最适合的评估指标是?

A.准确率(Accuracy)

B.F1分数(

文档评论(0)

1亿VIP精品文档

相关文档