- 1
- 0
- 约4.34千字
- 约 11页
- 2026-05-28 发布于广西
- 举报
数据挖掘大学试题及答案
一、单选题(每题1分,共10分)
1.数据挖掘过程中,用于发现隐藏在数据中的未知信息的技术是()。
A.统计分析
B.机器学习
C.数据可视化
D.数据清洗
【答案】B
【解析】机器学习是数据挖掘的核心技术,用于发现数据中的隐藏模式和规律。
2.下列哪个不是数据挖掘的常用任务?()。
A.分类
B.聚类
C.关联规则挖掘
D.时间序列分析
【答案】D
【解析】时间序列分析通常属于统计分析范畴,而非数据挖掘的主要任务。
3.在决策树算法中,选择分裂属性时常用的指标是()。
A.信息熵
B.方差分析
C.相关系数
D.均值偏差
【答案】A
【解析】信息熵是决策树算法中常用的分裂属性选择指标。
4.关联规则挖掘中,支持度表示()。
A.规则的置信度
B.项目集在数据中出现的频率
C.规则的预测能力
D.项目集的多样性
【答案】B
【解析】支持度表示项目集在数据中出现的频率。
5.聚类算法K-means的缺点是()。
A.对初始聚类中心敏感
B.只能处理数值型数据
C.时间复杂度低
D.空间复杂度高
【答案】A
【解析】K-means算法对初始聚类中心敏感,可能导致不同的运行结果。
6.在数据预处理中,处理缺失值的方法不包括()。
A.删除含有缺失值的记录
B.填充均值
C.使用模型预测缺失值
D.增加新的属性
【答案】D
【解析】增加新的属性不是处理缺失值的方法。
原创力文档

文档评论(0)