2026年数据建模工程师考试题库(附答案和详细解析)(0123).docxVIP

  • 1
  • 0
  • 约1.01万字
  • 约 14页
  • 2026-03-15 发布于江苏
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0123).docx

数据建模工程师专业能力考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

以下哪个指标最适合评估二分类模型在“正类样本非常少”场景下的性能?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1值

答案:C

解析:当正类样本极少时(如罕见病诊断),准确率易受负类样本主导(如99%负类时准确率可能虚高);精确率关注“预测为正的样本中实际为正的比例”,但可能因正类少而分母过小;召回率(TP/(TP+FN))直接衡量“实际正类被正确识别的比例”,更关注漏诊风险,因此最适合该场景。F1值是精确率和召回率的调和平均,适用于平衡两者的场景。

以下哪种数据预处理操作属于特征标准化(Z-ScoreNormalization)?

A.将年龄字段从“18-25”“26-35”转换为数值区间中点

B.将收入字段的取值范围压缩到[0,1]区间

C.将身高字段的取值调整为(值-均值)/标准差

D.将性别字段从“男/女”转换为0/1编码

答案:C

解析:标准化(Z-Score)的公式为(X-μ)/σ,其中μ是均值,σ是标准差,对应选项C。选项A是分箱后取值,属于特征离散化;选项B是归一化(Min-MaxScaling);选项D是类别编码(二值化)。

在决策树模型中,信息增益(InformationGain)主要用于?

文档评论(0)

1亿VIP精品文档

相关文档