集群分析 - 明道大学-----.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 集群分析 第一節 集群分析原理 第二節 SPSS的分層集群分析法 第三節 SPSS的K-Means集群分析法 第四節 SPSS的TwoStep集群分析法 第五節 集群分析範例 學習目標 認識集群分析的基本概念與目的。 瞭解集群分析的演算步驟。 探討相似性的衡量方法與公式。 理解層次集群法中的群與群間距離計算的各種方法。 認識集群結果的解釋、命名、驗證和後續分析。 認識SPSS的層次集群法程序、介面操作與結果分析。 認識SPSS的K-Means集群法程序、介面操作與結果分析。 認識SPSS的TwoStep集群法程序、介面操作與結果分析。 認識SPSS的各種因素分析應用實例。 瞭解集群程序的集群結果如何進行各種後續分析。 第一節 集群分析原理 一、集群分析的基本概念 二、集群分析的主要步驟 三、相似衡量 四、集群方法 五、集群結果的解釋和驗證 六、SPSS的Cluster分析程序 集群分析原理 集群分析(Cluster Analysis)是將資料檔中的觀測值或變數加以歸類在各個集群內,也就是把沒有分群的個體按相似程度歸於同一群。集群分析可以作資料簡化。 集群分析分群的方法有兩大形式,分層法(Hierarchical)與非分層法(Non-hierarchical),結合兩種方法的集群分析則稱為兩階段法(Two Step)。 分層法以個體間某項量測的距離或相似性將個體連結,但是事前並不知道分群的個數,通常可表示成樹型圖。 非分層法則是於事前依據其他研究或主觀認定,決定要將群體分成幾群,其中以K平均值法(K-Means)為代表。 圖10-1 SPSS的Cluster程序 一、集群分析的基本概念 集群分析使在同一集群內的事物具有高度的同質性(homogeneity),而不同集群的事物具有高度的異質性(heterogeneity)。 亦即將樣本分成幾群互相沒有交集的群組。 因素分析是將同質性高的變數(variables)集成一群;而集群分析則是將變數相似性高的觀察值(cases)集成一群。 集群分析的大部分應用都屬於探索性研究,最終結果是產生研究對象的分群。 二、集群分析的主要步驟(1/2) 集群分析至少都應該包括以下四個步驟: 第一步:根據研究的目的選擇合適的分群變數 第二步:計算相似性衡量 第三步:選定集群方法進行集群 第四步:對結果進行解釋和驗證 分群變數應該具有以下特點: 1. 和集群分析的目標密切相關 2. 反映了要分群對象的特徵 3. 在不同研究對象上的數值具有明顯差異 4. 變數之間不應該有高度相關 集群分析的主要步驟(2/2) 選擇分群變數時要注意克服「加入盡可能多的變數」這種錯誤觀念。 此外所選擇的變數之間不應該高度相關。 選定了分群變數,下一步就是計算研究對象間的相似性。相似性反映了研究對象間的親疏程度。 計算出相似性矩陣之後,下一步就是要對研究對象進行分群。這時主要涉及到兩個問題:一是選定集群方法;二是確定形成的分群數。 得到集群結果後,最後一步還應對結果進行驗證和解釋。 三、相似衡量(Measure) 很多種相似的衡量方法,都從不同的角度衡量了研究對象的相似性,其主要分為以下二類:1.距離衡量;2.關聯衡量。 距離衡量-計量資料: 關聯衡量-計質資料 1. 卡方值測距(Chi-square measure): 2. Phi平方值測距(Phi-square measure): 3. 二進位資料(Binary): 四、集群方法:層次集群法 層次集群法又可分為兩種層次集群法:凝聚法 (Agglomerative Method,或稱聚集法)和分離法 (Divisive Method,或稱分解法)。 凝聚法首先是把每個觀察值各自看成一群,先把距離最近的兩群合併。直到合併成一大群為止。 分解法和聚集法的過程相反,每一步增加一群,直到每個觀察值都自成一群為止。 目前SPSS採用凝聚法,故層次聚集法是集群分析中應用最廣泛的集群方法。 層次集群法的集群過程可以用一個樹狀圖(Dendogram)表示出來。 圖10-2 群與群距離計算方法比較的示意圖 圖10-3 以身高與體重進行 最短距離法集群所得到的樹狀圖 圖10-4 以身高與體重進行 最遠距離法集群所得到的樹狀圖 平均連結法(Average Linkage) 把兩群間的距離定義為兩群中所有觀察值之間距離的平均值,不再依賴於特殊點之間的距離。 平均連結法為集群效果較好、應用較廣泛的一種集群方法。 重心法(Centroid Clustering)與 中位數法(Median Clustering) 圖10-5 以身高與體重進行 重心法集群所得到的樹狀圖 最小變異數和法(華得法) 其基本思想是同一群內觀察值的變

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档