- 1
- 0
- 约3.57千字
- 约 12页
- 2026-05-25 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据管理局岗位考试数据挖掘常用算法(聚类/分类)题
一、单选题(共10题,每题2分,合计20分)
背景说明:某数据管理局需对城市公共服务资源进行优化配置,收集了2023年某市各区居民年龄分布、教育水平、医疗资源使用率等数据,计划采用聚类和分类算法进行分析。
1.以下哪种算法属于非监督学习算法?
A.决策树分类
B.K-近邻分类
C.K-means聚类
D.逻辑回归分类
2.在K-means聚类中,选择初始聚类中心时,常见的优化方法是?
A.随机选择K个样本点
B.使用K-means++算法
C.基于方差最小化原则
D.以上都是
3.某数据集特征维度较高,为降低维度并保留关键信息,常采用的方法是?
A.PCA降维
B.决策树剪枝
C.特征编码
D.SMOTE过采样
4.在DBSCAN聚类算法中,以下哪个参数对聚类效果影响最大?
A.聚类数量
B.邻域半径(eps)
C.核心点最小样本数(minPts)
D.距离度量方式
5.某分类任务中,若样本类别不均衡(多数类样本远多于少数类),可能导致的问题是?
A.模型过拟合
B.模型欠拟合
C.预测偏差(多数类被优先考虑)
D.计算效率降低
6.在支持向量机(SVM)分类中,以下哪种核函数适用于非线性可分数据?
A.线性核
B.
原创力文档

文档评论(0)