- 0
- 0
- 约7.92千字
- 约 11页
- 2026-03-07 发布于上海
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪种数据预处理方法最适用于处理偏态分布的数值型特征的缺失值?
A.用均值填充
B.用中位数填充
C.用众数填充
D.直接删除缺失行
答案:B
解析:偏态分布数据中,均值易受极端值影响,不能代表数据集中趋势;众数适用于分类型数据;直接删除会损失信息。中位数对极端值不敏感,能更好反映偏态分布的集中趋势,因此选B。
逻辑回归模型的损失函数通常是?
A.均方误差(MSE)
B.交叉熵损失(Cross-Entropy)
C.绝对误差(MAE)
D.Huber损失
答案:B
解析:逻辑回归用于分类任务,目标是最小化预测概率与真实标签的差异,交叉熵损失直接衡量概率分布的不一致性,是分类任务的常用损失函数。MSE和MAE用于回归任务,Huber损失是MSE和MAE的折中,均不适用于逻辑回归。
以下哪项不是随机森林(RandomForest)的特性?
A.基于多个决策树的集成
B.对特征重要性可量化
C.容易因过深树导致过拟合
D.支持并行训练
答案:C
解析:随机森林通过Bagging(自助采样)和特征随机选择,降低了单棵树的方差,整体模型不易过拟合。其他选项均为随机森林的典型特性。
在分类任务中,若正负样本比例为1:100,最适合的评估指标是?
A.准确率(Accuracy)
B.F1分数(
您可能关注的文档
- 2026年ESG分析师考试题库(附答案和详细解析)(0130).docx
- 2026年保险从业资格考试考试题库(附答案和详细解析)(0129).docx
- 2026年元宇宙架构师认证考试题库(附答案和详细解析)(0124).docx
- 2026年国际汉语教师证书考试题库(附答案和详细解析)(0121).docx
- 2026年强化学习工程师考试题库(附答案和详细解析)(0113).docx
- 2026年残障服务协调员考试题库(附答案和详细解析)(0116).docx
- 2026年注册城乡规划师考试题库(附答案和详细解析)(0116).docx
- 2026年生物信息分析师考试题库(附答案和详细解析)(0115).docx
- 2026年边缘计算工程师考试题库(附答案和详细解析)(0124).docx
- 69岁“红薯奶奶”轮椅上创业30余年.docx
原创力文档

文档评论(0)