- 2
- 0
- 约3.55千字
- 约 13页
- 2026-04-16 发布于陕西
- 举报
2026年数据挖掘与机器学习试题
考试时长:120分钟满分:100分
一、单选题(总共10题,每题2分,总分20分)
1.在数据预处理阶段,对于缺失值处理方法中,以下哪项不属于常见的填充策略?
A.均值填充
B.中位数填充
C.热卡填充
D.回归填充
2.决策树算法中,用于衡量节点分裂质量的指标是?
A.方差分析
B.信息增益
C.相关系数
D.均值绝对偏差
3.下列哪种算法属于监督学习中的分类算法?
A.K-means聚类
B.PCA降维
C.支持向量机
D.主成分回归
4.在特征工程中,以下哪项操作属于特征交叉的范畴?
A.标准化
B.对数变换
C.交互特征生成
D.数据分箱
5.以下哪种模型在处理高维稀疏数据时表现较好?
A.线性回归
B.决策树
C.逻辑回归
D.LASSO回归
6.在交叉验证中,k折交叉验证的k值通常选择为?
A.2
B.5
C.10
D.20
7.以下哪种方法不属于模型评估中的过拟合现象缓解策略?
A.正则化
B.数据增强
原创力文档

文档评论(0)