2026年数据建模工程师考试题库（附答案和详细解析）（0214）.docxVIP

2026年数据建模工程师考试题库（附答案和详细解析）（0214）.docx

数据建模工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

以下哪种算法属于监督学习？

A.K-means聚类

B.主成分分析（PCA）

C.支持向量机（SVM）

D.关联规则挖掘（Apriori）

答案：C

解析：监督学习需要标签数据进行训练，SVM通过样本标签学习分类边界，属于监督学习。A（K-means）、B（PCA）、D（Apriori）均为无监督学习，无需标签数据。

为解决模型过拟合问题，最不有效的方法是？

A.增加训练数据量

B.降低模型复杂度（如减少决策树深度）

C.引入L2正则化

D.增加特征维度

答案：D

解析：过拟合的本质是模型对训练数据过度拟合，泛化能力差。增加特征维度可能引入更多噪声，加剧过拟合；A（增加数据量）、B（降低复杂度）、C（正则化）均可缓解过拟合。

在分类任务中，若正样本极少（如1%），最适合的评估指标是？

A.准确率（Accuracy）

B.F1-score

C.均方误差（MSE）

D.召回率（Recall）

答案：D

解析：样本极不平衡时，准确率会因负样本占比高而虚高（如全预测负样本准确率99%）；召回率关注正样本被正确识别的比例，更适合评估稀有事件检测；F1-score综合精确率和召回率，但召回率在正样本优先场景下更关键；MSE用于回归任务。

以下哪项不属于特征工程的核心步骤？

A.特征缩放（如标准化）

更多 >