2026年考公计算机专业数据挖掘试题(含答案).docxVIP

  • 1
  • 0
  • 约6.32千字
  • 约 19页
  • 2026-03-12 发布于四川
  • 举报

2026年考公计算机专业数据挖掘试题(含答案).docx

2026年考公计算机专业数据挖掘试题(含答案)

单项选择题(每题2分,共40分)

1.以下哪种数据挖掘方法主要用于发现数据中的关联规则?

A.聚类分析

B.关联分析

C.分类分析

D.回归分析

答案:B。关联分析主要用于发现数据中不同项目之间的关联规则,比如在购物篮分析中找出哪些商品经常一起被购买。聚类分析是将数据对象分组;分类分析是将数据对象划分到不同类别;回归分析是建立变量之间的函数关系。

2.数据挖掘中,以下哪种技术可用于处理缺失值?

A.归一化

B.数据平滑

C.插补法

D.离散化

答案:C。插补法是处理缺失值的常用技术,如均值插补、中位数插补等。归一化是将数据按比例缩放;数据平滑用于去除数据中的噪声;离散化是将连续数据转换为离散值。

3.在决策树算法中,信息增益是用于:

A.选择最佳划分属性

B.计算树的深度

C.确定叶节点的类别

D.剪枝操作

答案:A。信息增益衡量了使用某个属性进行划分后数据的纯度提升程度,决策树算法通过比较不同属性的信息增益来选择最佳划分属性。计算树的深度有专门的方法;确定叶节点类别根据划分后的样本多数类;剪枝操作是为了防止过拟合。

4.K均值聚类算法的核心步骤不包括:

A.随机初始化K个聚类中心

B.计算每个样本到聚类中心的距离

C.计算数据的协方差矩阵

D.根据距离将样本分配到最近的聚类中心

答案:C

文档评论(0)

1亿VIP精品文档

相关文档