2026年数据建模工程师考试题库(附答案和详细解析)(0308).docxVIP

  • 0
  • 0
  • 约8.99千字
  • 约 12页
  • 2026-03-24 发布于江苏
  • 举报

2026年数据建模工程师考试题库(附答案和详细解析)(0308).docx

数据建模工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种方法最适合处理高维稀疏数据中的缺失值?

A.直接删除缺失值所在行

B.使用特征均值填充

C.基于随机森林的预测填充

D.用0填充缺失值

答案:C

解析:高维稀疏数据(如文本TF-IDF特征)中,缺失值可能隐含信息,直接删除(A)会损失样本;均值填充(B)适用于低维连续特征且分布集中的场景;0填充(D)可能引入偏差(如计数类特征)。随机森林填充(C)通过其他特征预测缺失值,能保留高维特征间的关联关系,是更合理的选择。

在分类任务中,若关注“正类样本被正确识别的比例”,应选择以下哪个评估指标?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1分数

答案:C

解析:召回率(Recall)=TP/(TP+FN),表示正类样本中被正确预测的比例,直接对应“正类被正确识别”的需求;准确率(A)受类别不平衡影响大;精确率(B)关注预测为正的样本中实际为正的比例;F1分数(D)是精确率与召回率的调和平均。

以下哪种算法属于生成式模型?

A.逻辑回归(LR)

B.支持向量机(SVM)

C.朴素贝叶斯(NaiveBayes)

D.梯度提升树(GBDT)

答案:C

解析:生成式模型通过学习联合概率P(X,Y)建模(如朴素贝叶斯假设特征独立,计算

文档评论(0)

1亿VIP精品文档

相关文档