2026年数据建模工程师考试题库（附答案和详细解析）（0220）.docxVIP

2026年数据建模工程师考试题库（附答案和详细解析）（0220）.docx

数据建模工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

以下哪项是分类任务中衡量模型对正类样本识别能力的指标？

A.准确率（Accuracy）

B.精确率（Precision）

C.召回率（Recall）

D.F1分数

答案：C

解析：召回率（Recall）定义为“真阳性/(真阳性+假阴性)”，反映模型正确识别正类样本的能力；准确率是整体正确分类的比例，精确率是“真阳性/(真阳性+假阳性)”，F1是精确率和召回率的调和平均。因此正确答案为C。

下列哪种方法最适合处理高维稀疏数据的特征选择？

A.方差阈值法

B.卡方检验

C.互信息法

D.主成分分析（PCA）

答案：C

解析：互信息法通过计算特征与目标变量的互信息值，衡量变量间的依赖关系，适用于高维稀疏数据（如文本数据）；方差阈值法仅考虑特征自身方差，无法反映与目标的关联；卡方检验适用于分类特征和分类目标；PCA是降维方法，非特征选择。故选C。

训练随机森林模型时，若出现严重过拟合，最有效的改进措施是？

A.增加树的数量（n_estimators）

B.减少树的最大深度（max_depth）

C.增大学习率（learning_rate）

D.提高最小样本分裂数（min_samples_split）

答案：B

解析：过拟合通常因模型复杂度过高导致，减少树的最大深度可降低单棵树的复杂度，缓解过拟合

更多 >