8集群與判別分析 - 集群與判別分析Clustering and discriminate.pptVIP

8集群與判別分析 - 集群與判別分析Clustering and discriminate.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8集群與判別分析 - 集群與判別分析Clustering and discriminate

步驟2:SPSS的Two Step集群分析法 集群與判別分析方法 選擇連續變數(亦可用類別變數) 步驟3:SPSS的Two Step集群分析法 集群與判別分析方法 待標準化變數 步驟4:SPSS的Two Step集群分析法 集群與判別分析方法 選擇圖形,勾選欲選選項 步驟5:SPSS的Two Step集群分析法 集群與判別分析方法 “輸出”選項,勾選欲選取項目 Two Step集群分析法結果輸出 集群與判別分析方法 由自動集群過程,依BIC準 則可以看出最適集群數為 二群,因此時BIC值為各個 集群中最小者。 Two Step集群分析法結果輸出 集群與判別分析方法 集群分配表 集群的輪廓(Profile) Two Step集群分析法結果輸出 集群與判別分析方法 集群圓餅圖 圓餅圖 Two Step集群分析法結果輸出 集群與判別分析方法 分群變數在各集群的信賴區間 結論 群集分析的目的是要將觀察點分群,使得群內同質性愈高,群間異質性愈高愈佳。層次群集法的分群成階層狀,每一階段形成的群集個數分別是 n-1 , n-2 , n-3 等等 層次群集法有數種不同的演算法,其差異主要是群間距離的定義不同 非層次法的分群則將每一觀察點分派至最接近的群集,因此需先指定分群的群數 分群時,先用層次法得出初始群集,再用非層次法重新分群,才能取到最佳的分群結果 集群與判別分析方法 Thanks ! * * * 塊頭集群結果與性別及居住地之卡方檢定分析表 集群與判別分析方法 集群結果的後續分析 通常集群分析只是研究的起點而不是終點 1 本範例將學生分成三群後,就可檢定塊頭群與其它變數的關係 2 由表的卡方檢定可知,塊頭與性別有顯著關聯,小塊頭皆為女性,大塊頭皆為男性,中塊頭則男女各半 3 塊頭與居住地為北部、中部或南部則沒有顯著關聯 4 集群與判別分析方法 SPSS的Cluster分析程序 1 分層法:限用於小型的資料檔,可分析區間(連續)、個數或二元變數。它能夠集群觀察值或變數;能夠計算某個範圍的可能解,並儲存每個集群的組員 2 K平均值法:限用於連續資料,並且需要事先指定集群數,可以分析大型的資料檔。能夠讀取各集群初始的中心,並將最後的集群中心儲存成外部 SPSS 檔。在SPSS之前的版本稱為快速集群(Quick Cluster) 3 兩階段法:可自動選取最佳的集群數 集群與判別分析方法 距離判別 按就近原則歸類! A 判別準則(discriminate criterion)可寫成: X ?G1: 如果D(X,G1)D(X,G2) X ?G2: 如果D(X,G1)D(X,G2) X待判: 如果D(X,G1)=D(X,G2) B 集群與判別分析方法 Fisher判別逐步判別(stepwise discriminant analysis) 基本思想 1.投影 2.即把K類的m維資料投影(變換)到某一 個方向,使得變換後的資料,同類別 的點“盡可能聚在一起”,不同類別 的點“盡可能分離”,以此達到分類 的目的。 3.投影(變換) 將原來m個變數綜合成L個新變數 A 從很多變數中篩選出重要作用的變數來建立判別函數,使所得函數的判別效果“最優” B 集群與判別分析方法 兩類Fisher判別示意圖 集群與判別分析方法 Y X L=b1X+b2Y G1 G2 判別結果的評價 原樣本(訓練樣本),組內考核,組內回代 考核樣本(test data set),組外考核 交叉驗證(cross validate) *棄一法,刀切法(jackknife) 判別分析的正確應用 理論上,類間分得越開,判別效果越好,類間距離越近,判別效果就越差 不同的判別方法間是個參照,大多情況下,效果近似 關鍵是指標是否具有判別價值 集群與判別分析方法 集群與判別 集群(clustering) 1.分成幾類? 2.每個樣品屬於哪一類? A 判別(discriminate) 1.已知分成幾類。(有師分類) 2.根據訓練樣品建立判別函數 3.根據判別函數對待判樣品進行歸類 B 集群與判別分析方法 SPSS集群分析操作教學 主題1:SPSS的分層集群分析法 主題2:SPSS的K-Means集群分析法 主題3:SPSS的Two Step集群分析法 集群與判別分析方法 步驟1:SPSS的分層集群分析法 集群與判別分析方法 分析→分類→階層集群分析法 步驟2:SPSS的分層集群分析法 集群與判別分析方法 選入欲分層集群之變數 步驟3:SPSS的分層集群分析法 集群與判別分析方法 最小層數:2 最大層數:4 步驟4:SPSS的分層集群分析法 集群與判別分析方法 圖形:

文档评论(0)

138****7331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档