- 0
- 0
- 约6.92千字
- 约 10页
- 2026-03-06 发布于上海
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
在分类任务中,若关注“实际为正例且被正确识别”的比例,应选择以下哪个指标?
A.准确率(Accuracy)
B.精确率(Precision)
C.召回率(Recall)
D.F1分数
答案:C
解析:召回率(Recall)定义为“真正例(TP)/(真正例+假反例(FN))”,即实际正例中被正确识别的比例;准确率是整体正确比例;精确率是预测正例中实际正确的比例;F1是精确率和召回率的调和平均。
以下哪种方法最常用于解决模型过拟合问题?
A.增加训练数据量
B.减少特征数量
C.提高学习率
D.降低模型复杂度
答案:A
解析:过拟合的本质是模型对训练数据的噪声过度学习,增加训练数据量可提升模型泛化能力;减少特征数量可能导致欠拟合;提高学习率可能加剧震荡;降低模型复杂度是间接方法,最直接有效的是增加数据。
特征工程中,“将年龄字段从连续值转换为‘青年/中年/老年’分箱”属于?
A.特征提取
B.特征选择
C.特征构造
D.特征缩放
答案:A
解析:特征提取是将原始特征转换为更具代表性的新特征(如分箱);特征选择是筛选重要特征;特征构造是组合现有特征生成新特征;特征缩放是标准化或归一化。
在k折交叉验证中,k的常见取值是?
A.2
B.5或10
C.样本量的平方根
D.与类别数相同
答案
原创力文档

文档评论(0)