分離分層法.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分離分層法

集群分析 (Cluster Analysis) 集群分析簡介 將個體(受測者或變數)分成有意義群組的一種統計分析技巧 與區別分析不一樣,群集分析的所分的群組(甚至群組個數)不是事前訂好的 群集分析原理(1/3) 群內差異小,群間差異大 依據個體間的相似性將樣本分成幾群互相沒有交集的群組,同群組內的個體相似性高,不同群組的個體相似性低 分層法與K組平均法 群集分析原理(2/3) 集群變數與異常點 一組用來比較個體特徵差異的變數 集群分析的結果會受不適合的集群變數的影響,也會受異常點的影響 集群分析的假設 群集分析原理(3/3) 群集分析群組數 群集分析一個主要問題是如何決定分成幾群,通常建議以樹形圖分群步驟中距離最大改變為分界點,當作決定群組個數的依據 群集分析資料型態 由個體測量所得個變數(特徵)的原始資料 相似矩陣或距離矩陣 已準備好的排序資料 集群分析方法主要有兩大型式 分層法(Hierarchical)與非分層法(Nonhierarchical) 實用上常結合此兩種而成稱為兩階段法 分層法 凝聚分層法 分離分層法 凝聚分層法(1/2) 開始時每一個體各為一群(n群),然後最近的兩個體合成一群(變成(n–1)群),依次結合使群組愈變愈少,最後所有個體結成一群 凝聚分層法的特性 兩個體一旦在同群內,則以後的步驟中必然在同一群內 凝聚分層法(2/2) 最近法(又稱單一聯結法) 最遠法(又稱完全聯結法) 平均法 中心法 華德法(又稱華德最小變異法) 分離分層法 開始時所有個體為一群,然後分成二群、三群,直到每一個體為獨立一群為止 方向與凝聚分層法相反 分離分層法較少使用 非分層法 凝聚分層法的缺點是兩個個體一旦在同一群組內,則其後就會在同群 非分層法是彌補此種缺點,最具代表性的是K組平均法(K - Means) 先給定一個中心點,然後依各個體到各中心點距離遠近重新移動個體到最近的群體,並算出各群體新的中心點,這樣繼續移動各個體到最接近的群,如此重覆進行直到個體不能再移動為止 兩階段法 結合分層法與非分層法二種方式 第一階段以華德法(或其他分層法亦可) 做分群,決定群組個數k 第二階段再以K?組平均法進行群集,移動各群組內的個體,但要保持全部群組仍有 k群 群內差異與群間差異之衡量指標 如何決定差異大小,須量化為一指標--距離 分層法必須先決定如何訂定個體間的距離及群體間的距離 兩個個體間的距離(1/2) 歐氏距離 歐氏距離平方 兩個個體間的距離(2/2) 城市街道距離 謝比雪夫距離 K組平均數法(K – Means)(1/2) 假如已知要將所有個體(或變數)分成K群則可利用K組平均數法做分群,它會將群體分成指定的群數 在計算上與‘ANOVA’很類似,開始時是任意將個體分成K組,然後將個體在各群間移動,使(1)群內的變異最小、(2)群間的變異最大 以K組平均數法所得群組應再做檢查,檢查這K組各個變數之平均數差異有多大 希望大部份的變數在這K組的平均數上有很顯著的差異,可對每一個變數做ANOVA,計算F值 群集數評量指標(1/4) 群集分析目的是將性質相似的個體分在同一群,性質相差大的分在不同群 除了上述群體間距離要大,群體內距離要小外,統計學家提出三個評量指標,分別為 (1) RMSSTD (2) R2 (3) SPR RMSSTD—新結合群體中所有變數的標準差 群集數評量指標(3/4) 當R2愈大表示群體間的相異性愈高,也間接地顯示分群的效果愈好 SPR愈小表示形成新結合群體時,損失群內相似性比例愈小,即新群體的群內相似性愈高 * * K組平均數法(K – Means)(2/2) 群集數評量指標(2/4) RMSSTD愈小表示群體內個體的相似性愈高 群集數評量指標(4/4) * *

您可能关注的文档

文档评论(0)

cynthia_h + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档