- 0
- 0
- 约8.99千字
- 约 12页
- 2026-03-24 发布于江苏
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪种方法最适合处理高维稀疏数据中的缺失值?
A.直接删除缺失值所在行
B.使用特征均值填充
C.基于随机森林的预测填充
D.用0填充缺失值
答案:C
解析:高维稀疏数据(如文本TF-IDF特征)中,缺失值可能隐含信息,直接删除(A)会损失样本;均值填充(B)适用于低维连续特征且分布集中的场景;0填充(D)可能引入偏差(如计数类特征)。随机森林填充(C)通过其他特征预测缺失值,能保留高维特征间的关联关系,是更合理的选择。
在分类任务中,若关注“正类样本被正确识别的比例”,应选择以下哪个评估指标?
A.准确率(Accuracy)
B.精确率(Precision)
C.召回率(Recall)
D.F1分数
答案:C
解析:召回率(Recall)=TP/(TP+FN),表示正类样本中被正确预测的比例,直接对应“正类被正确识别”的需求;准确率(A)受类别不平衡影响大;精确率(B)关注预测为正的样本中实际为正的比例;F1分数(D)是精确率与召回率的调和平均。
以下哪种算法属于生成式模型?
A.逻辑回归(LR)
B.支持向量机(SVM)
C.朴素贝叶斯(NaiveBayes)
D.梯度提升树(GBDT)
答案:C
解析:生成式模型通过学习联合概率P(X,Y)建模(如朴素贝叶斯假设特征独立,计算
您可能关注的文档
最近下载
- 歌德学院德语A1考试心得和技巧.pdf VIP
- (高清版)DB4401∕T 17-2019 《园林树木安全性评价技术规范》.pdf VIP
- 电影网站建设方案ppt模板下载.pptx
- 2022 省级研究生教学成果奖申报书-产教融合背景下行业特色高校.pdf VIP
- 2025年上海市高考历史真题卷(含答案与解析).pdf VIP
- 直接引语和间接引语(21张精品课件).ppt VIP
- 船舶火警系统T2000中文操作手册.pdf
- 最新直接引语和间接引语(21张PPT).ppt VIP
- 2026年3月-7月查摆问题:政绩观重点纠治十种偏差问题对照查摆清单(150条).docx VIP
- 急性胆囊炎课件课件(完整版).pdf VIP
原创力文档

文档评论(0)