- 8
- 0
- 约1.13千字
- 约 9页
- 2016-11-10 发布于天津
- 举报
統計諮詢
集群分析(Cluster) 根據觀察值在一群變項上的測量值進行分類的多變量分析方法。 在不同專業領域也稱為 Q型分類(Q Analysis)、 分類建構(typology construction)、 類型分析(classification) analysis) 及數值分類法(numerical taxonomy)。 意義與目的 集群分析可用在醫學商將各種疾病加以分類、行銷上將各客戶加以分群。 主要方法是使用一組的計量資料,加以計算各觀察值得相似性或相異性,然後使用各種分析的方法,將這些觀察值加以分類,進而能更有效地掌握各級群的性質。 相似性與相異性 資料的相異性多以距離來判斷。距離衡量有 街道距離(city block): 歐氏距離(Euclidean distance): 敏可斯基距離(Minkowski distance): 馬氏距離(Mahalanobis distance): 距離值愈大,表示兩倍觀察個體距離愈大,因此相異性也愈大。 另外可利用被觀察個體間的相關矩陣(稱為Q型矩陣),來表示其相似性。 分析方法 分成階層式及非階層式兩大類。 階層式 階層式的聚合步驟,是先計算出各被觀察個體間的距離或組內誤差矩陣,然後將最接近的兩個被觀察個體加以合併成一集群,在計算合併後各被觀察個體間的距離或組內誤差,並重複以上的程序,直到所有的觀察個體合併成同一集群。 常用的聚合方法有平均
原创力文档

文档评论(0)