- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
標準化資料計算歐幾里得距離
集群分析 概念及應用 集群分析(cluster analysis)是一種用來將屬量的觀測點分群或分類的分析方法 經過集群分析分群之後,在同一群內的觀測點針對某些特性而言,會具有一致性;而分屬不同群的觀測點,針對同樣的特性則會有顯著的不同 基於上述的定義,集群分析得以應用於財務、行銷、政治等許多的領域 利用集群分析可以將具有類似財務狀況的公司歸為一群,以利選取投資標的 在行銷方面,則可以將具有類似消費偏好的消費者區隔出來,以利於產品的定位和行銷 集群分析的基本想法 學生數學及英文成績散佈群 假設某高中有一班共有15位同學,將其依數學及英文兩科學習的表現予以分群,以判斷哪些同學需要進行特殊的輔導 集群分析的步驟 選擇衡量相似性(similarity)的方式 選擇分群的原則(如層級或非層級) 選擇分群的方法(如層級法中之華德法) 決定分群的群數 解釋分群的結果 衡量相似性的方式 衡量相似性的方式 距離(distance) 關聯係數(association coefficients) 相關係數(correlation coefficients) 利用距離來衡量相似性 依據任兩個觀測點或兩個群體間,在p個座標空間(即有p個據以分群的特性或變數)中的距離來決定哪些觀測點或群體是應該歸屬於同一類 兩個點i與j在p維的空間中的歐幾里得距離 標準化資料計算歐幾里得距離 馬式距離(Mahalanobis distance) 分群的原則與分群的方法 先根據分群的變數計算兩兩觀測點間的距離,然後將距離最近的點歸為一群 要做進一步的分群時,我們需要額外計算的是:已經分在一起的那一群觀測點全體與其他尚未分群的每一個觀測點之間的距離 將觀測點歸併時的順序考量 層級(hierarchical) 非層級(nonhierarchical) 兩階段法 層級分群法 層級分群法在分群時可分為凝聚分層(agglomerative)與分離分層(divisive) 凝聚分層法 在分群開始時,先將每一觀測點視為一群(因此如果有個樣本點,即有群),接著再逐步將接近的樣本點合為一群,使群數逐步減少 分離分層法 先確定想要分群的群數,將所有樣本點各自歸入其中的一群,再計算各群的中心值,然後針對每一樣本點,計算其至各群中心點的距離後,將其重新移動至距離最近的一群當中。反覆操作,直到不需重新移動為止 分群群數之決定 集群分析之樹狀圖 凝聚分層法(1) 單一聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點距離(通常以歐幾里得距離平方代表;如果兩群體各有n1 及n2 個觀測點,則共有n1x n2 個距離)中最近者,作為兩群體間之距離 當群體間的距離確定之後,距離近的群體可以進一步合為同一群,再重新計算群與群之間的距離,並進行下一步的合併 凝聚分層法(2) 完全聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點距離中最遠者,作為兩群體間之距離 相同地,當群體間的距離確定後,距離近的群體可以進一步合為同一群,再重新計算群與群之間的距離,並進行下一步的合併 凝聚分層法(3) 平均聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點所有距離的平均值,作為兩群體間之距離 凝聚分層法(4) 中心法 兩群體之間的距離定義為,以兩群體中心點之間的距離,作為兩群體間之距離 凝聚分層法(5) 華德法 求取所有群體的組內平方和(within-cluster sum of squares)最小的情況下,找到最適的分群狀況 在每一次的分群(由多群逐漸凝聚成少群)過程中,都會先計算各種可能分群情況下,各群體的組內平方和及其總和,然後再比較各種可能分群情況之組內平方和總和,並選取組內平方和總和最小的分群情況作為分群的結果 分離分層法 K組平均法(K-means) 先確定想要分群的群數,接著將所有樣本點各自歸入其中的一群,下一步再計算各群的中心值,然後針對每一樣本點,計算其至各群中心點的距離後,將其重新移動至距離最近的一群當中 計算各群的中心值,也針對每一樣本點計算其至各群新的中心點的距離,並將之重新移動至距離最近的一群當中 兩階段法 第一階段先以凝聚分層法(如華德法)分群,並決定選取的群數 第二階段再以此一決定的群數,以非凝聚分層法的K組平均法進行分群 既可某種程度解決非凝聚分層法主觀決定群數的問題,也可以改善層級分群法無法將觀測點變換所屬群體的問題 集群分析的相關檢定 新群體之root-mean-square standard deviation (RMSSTD) RMSSTD愈小代表分群的結果愈好 R-squared 若R-squared趨近於0,表示群體之間幾乎沒有差異性,分群效果差,若趨近於1,則表示分群效果
您可能关注的文档
- 方差分析平方和分解分析方法的一种新形式——数理统计方差分析.pdf
- annex-abilangual(revised3).xls-香港政府一站通.pdf
- 新加坡是个城市国家,面积680平方公里,人口400万,工业、商业和.pdf
- 台灣雖然僅是一座面積約36,000平方公里的蕞爾-台灣綜合研究院.pdf
- 1.5算符.pdf
- 鞋帶的長度指引任務一(平方及平方根)-樂道中學.pdf
- 鞋帶的長度指引任務一(平方及平方根).pdf
- 扬州依利安达电子有限公司年产180万平方米高精密度-江苏省环保厅.pdf
- 加拿大锐利能源有限公司-rallycanadaresourcesltd.pdf
- 和萌酒场商标登录证明书上海武夷路店(直营店).pdf
最近下载
- T_CECA20011-2021:含铁含锰地下水接触氧化法给水处理技术规程.pdf VIP
- 事故应急技术第一章 应急管理概论课件.ppt VIP
- 包括乘用车项目风险管理分析报告(仅供参考).docx VIP
- 高中物理必修2机械能守恒练习题.pdf VIP
- BS EN 573-3-2019 铝和铝合金.锻制产品的化学成分和形式.第3部分:产品的化学成分和形 式.pdf VIP
- 学堂在线 高技术与现代局部战争 章节测试答案.docx VIP
- 风光储电站成本构成全套.docx VIP
- 数字信号处理(英文版)教学课件.ppt VIP
- 白话机器学习算法.pdf VIP
- 职业技术学院网络营销与直播电商专业人才培养方案(2024版).pdf VIP
文档评论(0)