2026年数据建模工程师考试题库(附答案和详细解析)(0218).docxVIP

  • 0
  • 0
  • 约8.73千字
  • 约 11页
  • 2026-03-24 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0218).docx

数据建模工程师专业能力考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪个指标最适合评估类别高度不平衡的分类模型性能?

A.准确率(Accuracy)

B.F1分数(F1-score)

C.均方误差(MSE)

D.调整兰德指数(ARI)

答案:B

解析:准确率在类别不平衡时会因多数类的高占比产生误导(如99%负样本时,全预测负样本的准确率仍为99%);F1分数综合了精确率和召回率,更关注少数类的预测效果,适合不平衡场景;MSE是回归任务指标;ARI用于聚类评估。

在决策树训练中,使用信息增益作为划分标准时,可能导致的问题是?

A.对连续特征不敏感

B.倾向于选择取值较多的特征

C.无法处理缺失值

D.模型复杂度不足

答案:B

解析:信息增益的计算涉及特征的熵,取值多的特征(如ID类特征)会因分割后子集熵更低而被优先选择,但这类特征通常无实际预测意义;决策树可通过离散化处理连续特征(A错误),缺失值可通过替代分支处理(C错误),信息增益可能导致过拟合(复杂度高,D错误)。

以下哪种方法不属于处理类别不平衡的常用策略?

A.对少数类进行过采样(Oversampling)

B.对多数类进行欠采样(Undersampling)

C.调整模型损失函数权重(ClassWeight)

D.增加正则化参数

答案:D

解析:过采样、欠采样和调整类别权重是直接解

文档评论(0)

1亿VIP精品文档

相关文档