- 2
- 0
- 约3.87千字
- 约 13页
- 2026-06-03 发布于中国
- 举报
2026年数据科学《数据挖掘技术》模拟考卷
一、单选题(总共10题,每题2分)
1.数据挖掘过程中,哪一步骤通常用于发现数据中的潜在模式和关联?
A.数据预处理
B.数据清洗
C.关联规则挖掘
D.数据转换
2.在决策树算法中,哪种方法用于选择分裂属性?
A.信息增益
B.信息增益率
C.基尼不纯度
D.上述所有
3.以下哪种算法属于聚类算法?
A.决策树
B.支持向量机
C.K-means
D.K最近邻
4.在数据预处理中,缺失值处理的方法不包括:
A.删除含有缺失值的记录
B.使用均值、中位数或众数填充
C.使用回归预测缺失值
D.使用模型预测缺失值
5.在关联规则挖掘中,支持度和置信度的定义分别是什么?
A.支持度:项集在数据集中出现的频率;置信度:规则的前件出现时,后件也出现的概率
B.支持度:规则的前件出现时,后件也出现的概率;置信度:项集在数据集中出现的频率
C.支持度:规则的前件和后件同时出现的概率;置信度:项集在数据集中出现的频率
D.支持度:项集在数据集中出现的频率;置信度:规则的前件和后件同时出现的概率
6.在分类算法中,哪种方法用于评估模型的泛化能力?
A.过拟合
B.欠拟合
C.交叉验证
D.过度训练
7.在数据挖掘中,哪种方法用于减少数据的维度?
A.主成分分析
B.因子分析
C.线性
原创力文档

文档评论(0)