2026年数据科学《数据挖掘技术》模拟考卷.docVIP

下载本文档

2
0
约3.87千字
约 13页
2026-06-03 发布于中国
举报

2026年数据科学《数据挖掘技术》模拟考卷.doc

2026年数据科学《数据挖掘技术》模拟考卷

一、单选题（总共10题，每题2分）

1.数据挖掘过程中，哪一步骤通常用于发现数据中的潜在模式和关联？

A.数据预处理

B.数据清洗

C.关联规则挖掘

D.数据转换

2.在决策树算法中，哪种方法用于选择分裂属性？

A.信息增益

B.信息增益率

C.基尼不纯度

D.上述所有

3.以下哪种算法属于聚类算法？

A.决策树

B.支持向量机

C.K-means

D.K最近邻

4.在数据预处理中，缺失值处理的方法不包括：

A.删除含有缺失值的记录

B.使用均值、中位数或众数填充

C.使用回归预测缺失值

D.使用模型预测缺失值

5.在关联规则挖掘中，支持度和置信度的定义分别是什么？

A.支持度：项集在数据集中出现的频率；置信度：规则的前件出现时，后件也出现的概率

B.支持度：规则的前件出现时，后件也出现的概率；置信度：项集在数据集中出现的频率

C.支持度：规则的前件和后件同时出现的概率；置信度：项集在数据集中出现的频率

D.支持度：项集在数据集中出现的频率；置信度：规则的前件和后件同时出现的概率

6.在分类算法中，哪种方法用于评估模型的泛化能力？

A.过拟合

B.欠拟合

C.交叉验证

D.过度训练

7.在数据挖掘中，哪种方法用于减少数据的维度？

A.主成分分析

B.因子分析

C.线性

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年数据科学《数据挖掘技术》模拟考卷.docVIP