2026年数据建模工程师考试题库(附答案和详细解析)(0214).docxVIP

  • 3
  • 0
  • 约8.25千字
  • 约 12页
  • 2026-04-18 发布于上海
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0214).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种算法属于监督学习?

A.K-means聚类

B.主成分分析(PCA)

C.支持向量机(SVM)

D.关联规则挖掘(Apriori)

答案:C

解析:监督学习需要标签数据进行训练,SVM通过样本标签学习分类边界,属于监督学习。A(K-means)、B(PCA)、D(Apriori)均为无监督学习,无需标签数据。

为解决模型过拟合问题,最不有效的方法是?

A.增加训练数据量

B.降低模型复杂度(如减少决策树深度)

C.引入L2正则化

D.增加特征维度

答案:D

解析:过拟合的本质是模型对训练数据过度拟合,泛化能力差。增加特征维度可能引入更多噪声,加剧过拟合;A(增加数据量)、B(降低复杂度)、C(正则化)均可缓解过拟合。

在分类任务中,若正样本极少(如1%),最适合的评估指标是?

A.准确率(Accuracy)

B.F1-score

C.均方误差(MSE)

D.召回率(Recall)

答案:D

解析:样本极不平衡时,准确率会因负样本占比高而虚高(如全预测负样本准确率99%);召回率关注正样本被正确识别的比例,更适合评估稀有事件检测;F1-score综合精确率和召回率,但召回率在正样本优先场景下更关键;MSE用于回归任务。

以下哪项不属于特征工程的核心步骤?

A.特征缩放(如标准化)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档