2026年数据建模工程师考试题库(附答案和详细解析)(0114).docxVIP

  • 0
  • 0
  • 约7.55千字
  • 约 10页
  • 2026-03-21 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0114).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

数据建模流程中,首要的核心步骤是?

A.业务理解

B.数据清洗

C.模型训练

D.结果部署

答案:A

解析:根据CRISP-DM(跨行业数据挖掘标准流程),业务理解(BusinessUnderstanding)是数据建模的第一步,需明确业务目标、数据需求和成功标准。其他选项(数据清洗、模型训练、结果部署)均为后续步骤。

以下哪项是模型过拟合的典型表现?

A.训练集和测试集准确率都很低

B.训练集准确率高,测试集准确率低

C.训练集准确率低,测试集准确率高

D.训练集和测试集准确率接近

答案:B

解析:过拟合指模型在训练数据上表现优异(训练准确率高),但无法泛化到新数据(测试准确率低)。选项A是欠拟合表现,C不符合实际规律,D是模型泛化能力好的表现。

在二分类问题中,混淆矩阵的“真阳性(TP)”是指?

A.实际负类被预测为正类

B.实际正类被预测为正类

C.实际正类被预测为负类

D.实际负类被预测为负类

答案:B

解析:混淆矩阵中,TP(TruePositive)定义为“实际正类且预测为正类”的样本数。选项A是FP(假阳性),C是FN(假阴性),D是TN(真阴性)。

以下哪种算法通常不需要对特征进行标准化(Z-score)处理?

A.支持向量机(SVM)

B.逻辑回归

C.决策树

文档评论(0)

1亿VIP精品文档

相关文档