2026年数据科学《数据挖掘技术》模拟考卷.docVIP

  • 2
  • 0
  • 约3.87千字
  • 约 13页
  • 2026-06-03 发布于中国
  • 举报

2026年数据科学《数据挖掘技术》模拟考卷.doc

2026年数据科学《数据挖掘技术》模拟考卷

一、单选题(总共10题,每题2分)

1.数据挖掘过程中,哪一步骤通常用于发现数据中的潜在模式和关联?

A.数据预处理

B.数据清洗

C.关联规则挖掘

D.数据转换

2.在决策树算法中,哪种方法用于选择分裂属性?

A.信息增益

B.信息增益率

C.基尼不纯度

D.上述所有

3.以下哪种算法属于聚类算法?

A.决策树

B.支持向量机

C.K-means

D.K最近邻

4.在数据预处理中,缺失值处理的方法不包括:

A.删除含有缺失值的记录

B.使用均值、中位数或众数填充

C.使用回归预测缺失值

D.使用模型预测缺失值

5.在关联规则挖掘中,支持度和置信度的定义分别是什么?

A.支持度:项集在数据集中出现的频率;置信度:规则的前件出现时,后件也出现的概率

B.支持度:规则的前件出现时,后件也出现的概率;置信度:项集在数据集中出现的频率

C.支持度:规则的前件和后件同时出现的概率;置信度:项集在数据集中出现的频率

D.支持度:项集在数据集中出现的频率;置信度:规则的前件和后件同时出现的概率

6.在分类算法中,哪种方法用于评估模型的泛化能力?

A.过拟合

B.欠拟合

C.交叉验证

D.过度训练

7.在数据挖掘中,哪种方法用于减少数据的维度?

A.主成分分析

B.因子分析

C.线性

文档评论(0)

1亿VIP精品文档

相关文档