- 0
- 0
- 约7.41千字
- 约 10页
- 2026-04-26 发布于上海
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
数据预处理中,处理数值型特征缺失值时最不推荐的方法是?
A.用特征中位数填充
B.删除所有含缺失值的行
C.用特征均值填充
D.用相邻值插值填充
答案:B
解析:删除所有含缺失值的行可能导致大量数据丢失(尤其当缺失率较高时),严重降低数据利用效率;其他选项均为合理的缺失值处理方法(中位数/均值适用于数值型,插值适用于时序数据)。
评估正负样本极不平衡的分类模型时,最不适合的指标是?
A.F1-score
B.准确率(Accuracy)
C.AUC-ROC
D.召回率(Recall)
答案:B
解析:准确率在样本不平衡时会被多数类主导(如99%负样本时,全预测负样本准确率可达99%),无法反映模型对少数类的识别能力;其他指标(F1、AUC-ROC、召回率)均能更合理评估不平衡场景。
逻辑回归中使用L2正则化的主要目的是?
A.提高模型泛化能力
B.减少计算复杂度
C.解决类别不平衡
D.处理特征多重共线性
答案:A
解析:L2正则化通过惩罚大的权重系数,限制模型复杂度,防止过拟合,从而提升泛化能力;减少计算复杂度(与模型结构相关)、解决类别不平衡(需调整样本权重)、处理多重共线性(需特征筛选)均非L2正则化的核心目标。
随机森林中的“随机”不体现在以下哪项?
A.随机选择样本子集(Boo
您可能关注的文档
- 2026年中医养生保健师考试题库(附答案和详细解析)(0313).docx
- 2026年云计算架构师考试题库(附答案和详细解析)(0313).docx
- 2026年基金从业资格考试考试题库(附答案和详细解析)(0213).docx
- 2026年婚姻家庭咨询师考试题库(附答案和详细解析)(0311).docx
- 2026年建筑节能评估师考试题库(附答案和详细解析)(0221).docx
- 2026年机器人操作工程师考试题库(附答案和详细解析)(0310).docx
- 2026年注册压力容器工程师考试题库(附答案和详细解析)(0113).docx
- 2026年注册核工程师考试题库(附答案和详细解析)(0227).docx
- 2026年证券从业资格考试考试题库(附答案和详细解析)(0226).docx
- 2026年零信任安全架构师考试题库(附答案和详细解析)(0310).docx
原创力文档

文档评论(0)