2026年数据建模工程师考试题库(附答案和详细解析)(0203).docxVIP

  • 9
  • 0
  • 约8.84千字
  • 约 12页
  • 2026-04-21 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0203).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

在二分类任务中,若关注减少假阳性(FalsePositive),应重点优化以下哪个指标?

A.精确率(Precision)

B.召回率(Recall)

C.F1分数

D.准确率(Accuracy)

答案:A

解析:精确率(Precision)定义为TP/(TP+FP),直接反映模型在预测为正类的样本中实际为正类的比例,减少假阳性(FP)会直接提升精确率。召回率(Recall)关注TP/(TP+FN),减少假阴性;F1分数是精确率和召回率的调和平均;准确率是(TP+TN)/总样本,不直接针对FP。

以下哪种方法最适合处理高维稀疏的类别特征?

A.标准化(Z-Score)

B.归一化(Min-Max)

C.独热编码(One-HotEncoding)

D.对数变换(LogTransformation)

答案:C

解析:独热编码通过将类别特征转换为二进制向量(每个类别对应一个维度),适用于高维稀疏的类别特征(如“职业”“地区”)。标准化和归一化用于连续特征的尺度统一;对数变换用于处理偏态分布的连续特征。

线性回归模型中,若出现多重共线性,最可能的后果是?

A.模型欠拟合

B.参数估计方差增大

C.预测准确率显著下降

D.损失函数无法收敛

答案:B

解析:多重共线性指特征间高度相关,会导致参

文档评论(0)

1亿VIP精品文档

相关文档