- 0
- 0
- 约5.35万字
- 约 48页
- 2026-01-09 发布于北京
- 举报
轮廓图:一种用于聚类分析解释和验证的图形辅助工具
彼得・J・罗西乌
弗里堡大学,ISES,CH‑1700弗里堡
收到日期:
修订日期:
:提出了一种新的图形显示方法,用于分区技术。每个聚类通过所谓的轮廓
图表示,该图基于其紧密性和分离性的比较。此轮廓图展示了哪些对象在其聚类中
位置良好,哪些对象则位于聚类之间。通过将所有轮廓图组合成一个单一的图,可
以展示整个聚类情况,从而评估各聚类的相对质量并概览数据配置。平均轮廓宽度
了对聚类有效性的评价,可用于选择‘适当’的聚类数量。
:图形显示,聚类分析,聚类有效性,分类
1.图形显示的需求
有许多算法可以将一组对象划分为聚类,例如均值方法[6,9,13]和‑中位数方法
[20]。这种划分技术的结果是一系列包含其对象的聚类列表,这不如层次方法的树
状图那样直观吸引人。希望在第2节中介绍的图形显示能够有助于聚类分析结果的
解释,如第3节中的示例所示。在第4节中,将描述一些其他显示方式。
假设需要聚类的对象有个,这些对象可能是人、花、案例、统计变量等。聚类
算法主要基于两种常用的输入数据结构进行操作(见[18,第1章和2])。第法
是通过一系列测量或属性来表示对象,例如身高、体重、、颜色等。在
Tucker的[19]术语中,这种对象与属性矩阵被称为二模态,因为行和列实体不同。
当测量值在区间尺度上时,可以计算任何两个对象和之间的欧几里得距离)。
这使我们转向第二种数据结构,即所有对象对的接近度集合。这对应于一个一模
矩阵,因为行和列实体是同一组对象。考虑两种类型的
Silhouettes:agraphicalaidtotheinterpretationand
validationofclusteranalysis
PeterJ.ROUSSEEUW
UniversityofFribourg,ISES,CH-1700Fribourg,Switzerland
Received13June1986
Revised27November1986
:Anewgraphicaldisyisproposedforpartitioningtechniques.Eachclusteris
representedbyaso-calledsilhouette,whichisbasedonthecomparisonofitstightness
andseparation.Thissilhouetteshowswhichobjectsliewellwithintheircluster,and
whichonesaremerelysomewhereinweenclusters.Theentireclusteringis
disyedbycombiningthesilhouettesintoasingleplot,allowinganappreciationofthe
relativequalityoftheclustersandanoverviewofthedataconfiguration.Theaverage
silhouettewidthprovidesanevaluationofclusteringvalidity,andmightbeusedto
selectan‘appropriate’numberofclusters.
Keywords:Graphicaldisy,clusteranalysis,clusteringvalidity,classification
1.Theneedforgraphicaldisys
Therearemanyalgorithmsforpartitioningasetofobjectsintoclusters,suchasthe
-meansmethod[6,9,13]andthe-medianapproach[20].Theresultofsucha
partitioning
原创力文档

文档评论(0)