- 0
- 0
- 约8.96千字
- 约 12页
- 2026-05-02 发布于上海
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是分类任务中衡量模型对正类样本识别能力的指标?
A.准确率(Accuracy)
B.精确率(Precision)
C.召回率(Recall)
D.F1分数
答案:C
解析:召回率(Recall)定义为“真阳性/(真阳性+假阴性)”,反映模型正确识别正类样本的能力;准确率是整体正确分类的比例,精确率是“真阳性/(真阳性+假阳性)”,F1是精确率和召回率的调和平均。因此正确答案为C。
下列哪种方法最适合处理高维稀疏数据的特征选择?
A.方差阈值法
B.卡方检验
C.互信息法
D.主成分分析(PCA)
答案:C
解析:互信息法通过计算特征与目标变量的互信息值,衡量变量间的依赖关系,适用于高维稀疏数据(如文本数据);方差阈值法仅考虑特征自身方差,无法反映与目标的关联;卡方检验适用于分类特征和分类目标;PCA是降维方法,非特征选择。故选C。
训练随机森林模型时,若出现严重过拟合,最有效的改进措施是?
A.增加树的数量(n_estimators)
B.减少树的最大深度(max_depth)
C.增大学习率(learning_rate)
D.提高最小样本分裂数(min_samples_split)
答案:B
解析:过拟合通常因模型复杂度过高导致,减少树的最大深度可降低单棵树的复杂度,缓解过拟合
您可能关注的文档
- 2026年侍酒师考试题库(附答案和详细解析)(0408).docx
- 2026年城市更新咨询师考试题库(附答案和详细解析)(0416).docx
- 2026年工业互联网工程师考试题库(附答案和详细解析)(0417).docx
- 2026年思科认证网络工程师(CCNP)考试题库(附答案和详细解析)(0408).docx
- 2026年智慧教育工程师考试题库(附答案和详细解析)(0407).docx
- 2026年注册化工工程师考试题库(附答案和详细解析)(0219).docx
- 2026年注册土木工程师考试题库(附答案和详细解析)(0409).docx
- 2026年注册振动工程师考试题库(附答案和详细解析)(0403).docx
- 2026年注册财富管理师(CWM)考试题库(附答案和详细解析)(0417).docx
- 2026年证券从业资格考试考试题库(附答案和详细解析)(0402).docx
原创力文档

文档评论(0)