2026年数据建模工程师考试题库(附答案和详细解析)(0220).docxVIP

  • 0
  • 0
  • 约8.96千字
  • 约 12页
  • 2026-05-02 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0220).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是分类任务中衡量模型对正类样本识别能力的指标?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1分数

答案:C

解析:召回率(Recall)定义为“真阳性/(真阳性+假阴性)”,反映模型正确识别正类样本的能力;准确率是整体正确分类的比例,精确率是“真阳性/(真阳性+假阳性)”,F1是精确率和召回率的调和平均。因此正确答案为C。

下列哪种方法最适合处理高维稀疏数据的特征选择?

A.方差阈值法

B.卡方检验

C.互信息法

D.主成分分析(PCA)

答案:C

解析:互信息法通过计算特征与目标变量的互信息值,衡量变量间的依赖关系,适用于高维稀疏数据(如文本数据);方差阈值法仅考虑特征自身方差,无法反映与目标的关联;卡方检验适用于分类特征和分类目标;PCA是降维方法,非特征选择。故选C。

训练随机森林模型时,若出现严重过拟合,最有效的改进措施是?

A.增加树的数量(n_estimators)

B.减少树的最大深度(max_depth)

C.增大学习率(learning_rate)

D.提高最小样本分裂数(min_samples_split)

答案:B

解析:过拟合通常因模型复杂度过高导致,减少树的最大深度可降低单棵树的复杂度,缓解过拟合

文档评论(0)

1亿VIP精品文档

相关文档