- 1、本文档共55页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS教程CH9 集群分析
集群分析 內容大綱 9.1 認識集群分析 9.2 K平均數集群(非階層集群法) 9.3 階層集群分析法 9.4 二階段集群法 9.1 認識集群分析 集群分析(cluster analysis),又稱群集分析,其目的在於將物件(包括個體、產品、品牌、國家、城市等)加以集結成群,使得在群體內的個體的同質(homogeneity)很高,群體之間的異質性(heterogeneity)很高。這個技術在我們區分市場區隔(market segment)時特別有用 集群分析與因素分析 集群分析與因素分析類似,如果我們針對變數做集群分析,不就等於應用因素分析了嗎? 當我們針對個人來建立集群時,這種分析叫做Q分析(Q-Analysis)。 當我們針對變數來建立集群時,這種分析叫做R分析(R-Analysis) 集群分析與區別分析 集群分析與區別分析的差別: 區別分析是以界定清楚的二群(或以上)來檢視什麼變數最能區分這些群,而集群分析是將未經區別化(undifferentiated group)的一群個人、事件或物體,重新組合成同質性的次群體。 集群分析的基本原理是基於以下的步驟: 選擇要做集群分析的樣本 界定衡量這些物體、事件或個人的變數利用相關分析、歐幾里得距離(Euclidean distances)及其他技術來計算個體之間的相似性; 選擇互斥的集群(也就是使得群內同質性、群間異質性極大化的集群)或層級式排列的集群; 做集群間的比較與驗證。 集群分析是一種互依分析(Analysis of Interdependence)技術。所謂互依法是將所有的變數「一視同仁」。如圖9-1所示。 集群分析分為非階層集群法(non-hierarchical methods)、階層集群法(hierarchical methods)。 在SPSS中,非階層集群法由「K平均數集群」(K-Means Cluster)程序來執行;階層集群法由「階層集群分析法」(Hierarchical)程序來執行。此外還有二階段集群法。 9.2 K平均數集群(非階層集群法) 非階層集群法是在分群的過程中,將原有的集群加以打散,並重新形成新的集群。非階層集群法也有幾種不同的計算方法。各種方法都是先選出某些種子點(seed point)作為集群的中心。K平均數法(K-means method)是使用得比較普遍的方法,其演算步驟如下: 將各個事物點(個體)分割成K個原始集群; 計算某一個事物點到各集群的平均數(重心)的距離(距離的計算通常採用歐幾里得距離),然後將一些事物點分派到距離最近的那個集群。重心計算後得到新事物點的那個集群的平均數,以及失去該事物點的那個集群的平均數。 重複步驟 2),直到各事物點都不必重新分派到 其他的集群時為止。 大海汽車公司想要了解汽車購買者的市場區隔,其研究人員所選擇的變數是年齡、所得及家庭大小。 開啟檔案(檔案位置:...\Chap09\K-Means Cluster.sav)。資料檔中包括所得、年齡、家庭大小。這三個變數均是區間尺度。 在SPSS中,按〔Analyze〕、〔Classify〕、〔K-Means Cluster〕(〔分析〕〔分類〕 〔K平均數集群〕),在所呈現的「K-Means Cluster Analysis」視窗中,將所得、年齡、家庭大小這三個變數選入「Variables」下的方格中。「Number of Clusters」(集群數目)內定值為2,「Method」(集群方法)的內定方法為「Iterate and classify」(疊代及分類)。我們所做的設定如圖9-2所示。 Iternation(疊代次數) 在「K-Means Cluster Analysis」視窗中,按〔Iterate〕,就會出現「K-Means Cluster Analysis: Iterate」視窗,如圖9-3所示。「Maximum Iterations」(最大疊代次數)的內定值為10,「Convergence Criterion」(收斂標準)為0。 下表是利用SPSS中的K平均數法, 進行集群分析的結果: 9.3 階層集群分析法 階層集群分析法有二種方法:集結式集群法(agglomerate hierarchical method)及 區分式集群法(divisive hierarchical method) ‵集結式集群法在開始時是每一個事物點自成一個集群,然後根據相似性準則,把相近的事物點合併成集群,一直到所有的事物點都併入同一集群時為止。 ‵區分式集群法在開始時是所有的事物點形成一個集群,然後再根據相似性準則,把事物點劃分成較不相近的兩個集群,直到所有的事物點都自成一個集群時為止。集結式集群法使用得較為普遍。 Ward連法
文档评论(0)