2025年聚类算法性能评估习题(含答案与解析).docxVIP

  • 1
  • 0
  • 约4.44千字
  • 约 11页
  • 2026-06-01 发布于四川
  • 举报

2025年聚类算法性能评估习题(含答案与解析).docx

2025年聚类算法性能评估习题(含答案与解析)

一、单项选择题(每题3分,共15分)

1.以下关于聚类算法性能评估指标的描述中,错误的是()。

A.轮廓系数(SilhouetteCoefficient)取值范围为[-1,1],值越大表示聚类效果越好

B.Calinski-Harabasz指数(CH指数)通过类间离散度与类内离散度的比值衡量聚类质量,值越小越好

C.Davies-Bouldin指数(DB指数)计算各簇与其最相似簇的相似度平均值,值越小表示聚类效果越好

D.对于有标签的数据集,调整兰德指数(ARI)可以衡量聚类结果与真实标签的一致性

2.针对高维稀疏数据(如文本数据),以下最不适合作为聚类评估指标的是()。

A.轮廓系数(基于欧氏距离)

B.归一化互信息(NMI)

C.均方轮廓宽度

D.调整兰德指数(ARI)

3.某聚类任务中,使用K-means算法得到3个簇,计算其轮廓系数时,某样本点i的a(i)=0.4(簇内平均距离),b(i)=0.6(最近簇平均距离),则该点的轮廓系数s(i)为()。

A.0.33

B.0.25

C.0.5

D.0.17

4.以下场景中,适合使用外部评估指标的是()。

A.探索未知用户行为模式的聚类任务(无真实标签)

B.验证聚类结果与已

文档评论(0)

1亿VIP精品文档

相关文档