- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
集群分析概念
LOGO 第17章 集群分析 ?本章的學習主題 ? 1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法 * 17.1 集群分析概念 集群分析 (cluster analysis) 是一種將樣本觀察值進行分析,將具有某些共同特性者予以整合在一起,然後分配到特定的群體,最後形成許多不同集合集群的一種分析方法。 集群分析與因素分析的概念大致相同,但前者係將不同的觀察值依相對距離的遠近加以分類成不同集群,然後對不同集群所具有的特性程度加以歸納並命名;而後者乃係將不同的變數依照相關程度加以萃取成少數的因素,然後依照各因素中所含變數來加以命名。 * * 集群分析是將某些具有共同特性的objects或樣本予以整合,集群分析的結果顯示出內部同質性與外部異質性,即達到群內差異最小、群間差異最大。集群分析係將不同觀察值,依相對距離遠近加以分類為不同集群,其主要目的在界定資料結構,將最相似的觀察值納入同一集群中。 例如表17─1中係收集15家商店的銷售數量及顧客人次的資料,若我們希望以商店的業績(銷售數量及顧客人次)作分群,將15家商店作不同業績的歸納,使同群內的商店其業績很接近,而不同群的商店其業績相差很大。 17.1 集群分析概念 * 表 17-1 商店業績統計表 商店編號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 銷售數量 1153 1135 1155 1151 1146 1147 1141 1135 1139 1148 1145 1150 1139 1134 1140 顧客人次 216 199 222 218 213 214 211 202 205 215 211 223 207 199 210 圖 17-1 商店業績分群示意圖 17.1 集群分析概念 * 17.2 界定研究問題 界定研究問題 變數及資料篩選 相似性衡量 選擇集群方法 及 決定集群數目 解釋及驗證集群 探索性 驗證性 變數的共線性 極端值的剔除 資料的標準化 距離衡量 歐式距離 馬式距離 街道距離 混合式距離 集群方法 層次集群方法 非層次集群方法 集群數目之決定 觀察值集合順序表 垂直冰柱圖 樹狀圖 層次集群與非層次集群之比較 區別分析 圖 17-2 集群分析步驟 17.3 變數與資料的篩選 集群分析在變數與資料的篩選上須考量: 1.變數的共線性 2.極端值的剔除 3.資料的標準化 * * 相似性乃係指任何二個樣本,相對於其他樣本而言,如果在各種變數上有相近之處,即代表它們在很多方面具有共同的特性,則這對樣本可視為是具有相似性。 進行相似性衡量必須決定要採用何種設定基礎,不同的衡量方法,可能產生不同的分群結果。而所謂距離衡量係指以點與點之間的距離為代表,即計算點與點間的距離,透過找到點與點間距離最小的,來辨識其相似性。 17.4 相似性衡量 17.4 相似性衡量 * 在集群的概念中,距離最小的樣本會先集結,然後再找距離比較大者集結,至最後全部集結為止,其中較重要且較常使用到的,仍屬歐氏距離衡量法 圖 17—3 集群分析歐氏距離計算方法 歐氏距離之公式為: 17.4 相似性衡量 * 表 17 – 2 歐氏距離計算表 觀察值 1 2 3 4 5 6 7 8 9 10 1 2 2.778 3 2.028 0.361 4 7.444 2.444 4.250 5 6.444 1.444 2.250 1.000 6 2.250 1.694 2.111 6.028 6.028 7 1.444 6.444 5.250 14.000 13.000 3.028 8 13.444 18.444 15.250 34.000 29.000 13.028 8.000 9 7.444 2.444 4.250 0.000 1.000 6.028 14.000 34.000 10 17.278 14.500 13.361 26.944 22.944 10.694 13.000 5.944 26.944 本章範例是以行為意圖之構念作為分群變數,根據社群推薦、社群參與和品牌忠誠等三個因素來作為分群的標準,而在本範例中,其前10個觀察值的歐氏距離平方如表17-2所示 17.5 選擇集群方法及決定集群數目 集群分析的方法,可分為兩大類,五種方法: 1.層次集群方法(hierarchical methods) (1)單一連鎖法(single linkage) (2)完全連鎖法(complete linkage) (3)中心法(centr
您可能关注的文档
最近下载
- 2023年山东省青岛市市北区“未来之星”选拔活动试卷(四、五年级).pdf VIP
- 鲁科版高中化学目录.pdf VIP
- 金融英语翻译 Chapter 15 应收款项.pptx VIP
- 烟草法律知识考试真题题库(含答案).pdf VIP
- 三年级上册 劳动教案.pdf VIP
- DB12T 775-2018 防雷装置检测业务规范.docx VIP
- 专题2.6 一元二次方程应用-几何动态问题(专项训练).pdf VIP
- 觉醒年代人物小传800字.doc VIP
- [通力KONE电梯资料]CTP-07.30.S2A_安全钳.pdf VIP
- 【名校课堂】九年级数学下册 28.1 锐角三角函数 正弦(第1课时)练习 (新版)新人教版.doc VIP
文档评论(0)