轮廓图:聚类分析解释与验证图形辅助工具.pdfVIP

  • 0
  • 0
  • 约5.35万字
  • 约 48页
  • 2026-01-09 发布于北京
  • 举报

轮廓图:聚类分析解释与验证图形辅助工具.pdf

轮廓图:一种用于聚类分析解释和验证的图形辅助工具

彼得・J・罗西乌

弗里堡大学,ISES,CH‑1700弗里堡

收到日期:

修订日期:

:提出了一种新的图形显示方法,用于分区技术。每个聚类通过所谓的轮廓

图表示,该图基于其紧密性和分离性的比较。此轮廓图展示了哪些对象在其聚类中

位置良好,哪些对象则位于聚类之间。通过将所有轮廓图组合成一个单一的图,可

以展示整个聚类情况,从而评估各聚类的相对质量并概览数据配置。平均轮廓宽度

了对聚类有效性的评价,可用于选择‘适当’的聚类数量。

:图形显示,聚类分析,聚类有效性,分类

1.图形显示的需求

有许多算法可以将一组对象划分为聚类,例如均值方法[6,9,13]和‑中位数方法

[20]。这种划分技术的结果是一系列包含其对象的聚类列表,这不如层次方法的树

状图那样直观吸引人。希望在第2节中介绍的图形显示能够有助于聚类分析结果的

解释,如第3节中的示例所示。在第4节中,将描述一些其他显示方式。

假设需要聚类的对象有个,这些对象可能是人、花、案例、统计变量等。聚类

算法主要基于两种常用的输入数据结构进行操作(见[18,第1章和2])。第法

是通过一系列测量或属性来表示对象,例如身高、体重、、颜色等。在

Tucker的[19]术语中,这种对象与属性矩阵被称为二模态,因为行和列实体不同。

当测量值在区间尺度上时,可以计算任何两个对象和之间的欧几里得距离)。

这使我们转向第二种数据结构,即所有对象对的接近度集合。这对应于一个一模

矩阵,因为行和列实体是同一组对象。考虑两种类型的

Silhouettes:agraphicalaidtotheinterpretationand

validationofclusteranalysis

PeterJ.ROUSSEEUW

UniversityofFribourg,ISES,CH-1700Fribourg,Switzerland

Received13June1986

Revised27November1986

:Anewgraphicaldisyisproposedforpartitioningtechniques.Eachclusteris

representedbyaso-calledsilhouette,whichisbasedonthecomparisonofitstightness

andseparation.Thissilhouetteshowswhichobjectsliewellwithintheircluster,and

whichonesaremerelysomewhereinweenclusters.Theentireclusteringis

disyedbycombiningthesilhouettesintoasingleplot,allowinganappreciationofthe

relativequalityoftheclustersandanoverviewofthedataconfiguration.Theaverage

silhouettewidthprovidesanevaluationofclusteringvalidity,andmightbeusedto

selectan‘appropriate’numberofclusters.

Keywords:Graphicaldisy,clusteranalysis,clusteringvalidity,classification

1.Theneedforgraphicaldisys

Therearemanyalgorithmsforpartitioningasetofobjectsintoclusters,suchasthe

-meansmethod[6,9,13]andthe-medianapproach[20].Theresultofsucha

partitioning

文档评论(0)

1亿VIP精品文档

相关文档