2026年数据建模工程师考试题库(附答案和详细解析)(0128).docxVIP

  • 3
  • 0
  • 约7.58千字
  • 约 11页
  • 2026-04-22 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0128).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是数据清洗的核心目标?

A.增加数据维度

B.消除数据中的噪声和不一致性

C.提升数据可视化效果

D.直接用于模型训练

答案:B

解析:数据清洗的主要目的是处理缺失值、异常值和不一致数据(如格式错误),确保数据质量,为后续建模提供可靠输入。选项A(增加维度)属于特征工程;C(可视化)是分析手段;D(直接训练)忽略清洗必要性,均错误。

过拟合的典型表现是?

A.训练集和测试集误差均很高

B.训练集误差低,测试集误差高

C.训练集误差高,测试集误差低

D.训练集和测试集误差均很低

答案:B

解析:过拟合指模型过度学习训练数据的细节(包括噪声),导致泛化能力差。此时训练误差低(拟合好),但测试误差高(无法泛化)。选项A是欠拟合表现;C和D不符合定义,错误。

混淆矩阵中,“真阳性率(TPR)”的计算公式是?

A.TP/(TP+FN)

B.TP/(TP+FP)

C.TN/(TN+FP)

D.TN/(TN+FN)

答案:A

解析:TPR(召回率)反映正类样本被正确识别的比例,公式为TP/(实际正类总数)=TP/(TP+FN)。选项B是精确率(Precision);C是真负率(TNR);D无实际意义,错误。

线性回归模型通常使用以下哪种损失函数?

A.交叉熵损失

B.Hinge损失

C.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档