2026年大数据分析《数据挖掘》模拟卷.docVIP

  • 2
  • 0
  • 约3.9千字
  • 约 11页
  • 2026-05-08 发布于山东
  • 举报

2026年大数据分析《数据挖掘》模拟卷.doc

2026年大数据分析《数据挖掘》模拟卷

姓名:_____?准考证号:_____?得分:______

一、单选题,(总共10题,每题2分)

1.以下哪项不属于数据挖掘的主要任务?

A.分类

B.聚类

C.数据清理

D.关联规则挖掘

2.决策树算法中,用于选择划分属性的指标通常是

A.信息增益

B.基尼系数

C.均方误差

D.相关系数

3.以下哪种聚类算法对数据分布的适应性较好?

A.K-Means

B.DBSCAN

C.层次聚类

D.谱聚类

4.支持向量机的核心思想是

A.寻找最大间隔超平面

B.最小化分类误差

C.最大化数据点间距

D.拟合数据分布

5.数据挖掘中,用于处理缺失值的方法不包括

A.填充法

B.删除法

C.插补法

D.平滑法

6.以下关于频繁项集挖掘的说法,错误的是

A.频繁项集是指支持度大于阈值的项集

B.Apriori算法是经典的频繁项集挖掘算法

C.频繁项集的长度一定相同

D.可以通过剪枝策略减少计算量

7.朴素贝叶斯分类器的假设是

A.特征之间相互独立

B.特征之间存在线性关系

C.数据服从正态分布

D.分类结果只有两种

8.以下哪种算法常用于处理文本数据挖掘?

A.神经网络

B.支持向量机

C.朴素贝叶斯

D.以上都是

9.数据挖掘过程中,数据预处理阶段不包

文档评论(0)

1亿VIP精品文档

相关文档