2026年数据管理局岗位考试数据挖掘常用算法聚类分类题.docxVIP

  • 1
  • 0
  • 约3.57千字
  • 约 12页
  • 2026-05-25 发布于福建
  • 举报

2026年数据管理局岗位考试数据挖掘常用算法聚类分类题.docx

第PAGE页共NUMPAGES页

2026年数据管理局岗位考试数据挖掘常用算法(聚类/分类)题

一、单选题(共10题,每题2分,合计20分)

背景说明:某数据管理局需对城市公共服务资源进行优化配置,收集了2023年某市各区居民年龄分布、教育水平、医疗资源使用率等数据,计划采用聚类和分类算法进行分析。

1.以下哪种算法属于非监督学习算法?

A.决策树分类

B.K-近邻分类

C.K-means聚类

D.逻辑回归分类

2.在K-means聚类中,选择初始聚类中心时,常见的优化方法是?

A.随机选择K个样本点

B.使用K-means++算法

C.基于方差最小化原则

D.以上都是

3.某数据集特征维度较高,为降低维度并保留关键信息,常采用的方法是?

A.PCA降维

B.决策树剪枝

C.特征编码

D.SMOTE过采样

4.在DBSCAN聚类算法中,以下哪个参数对聚类效果影响最大?

A.聚类数量

B.邻域半径(eps)

C.核心点最小样本数(minPts)

D.距离度量方式

5.某分类任务中,若样本类别不均衡(多数类样本远多于少数类),可能导致的问题是?

A.模型过拟合

B.模型欠拟合

C.预测偏差(多数类被优先考虑)

D.计算效率降低

6.在支持向量机(SVM)分类中,以下哪种核函数适用于非线性可分数据?

A.线性核

B.

文档评论(0)

1亿VIP精品文档

相关文档