- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
*6、離差平方和法類似於方差分析的想法,如果類分得恰當,同類內的樣品之間的離差平方和應較小,而類間的離差平方和應當較大。離差平方和法的思路是,當k固定時,選擇使S達到最小的分類。先讓n個樣品各自成一類,然後縮小一類,每縮小一類離差平方和就要增大,選擇使S2增加最小的兩類合併,直到所有的樣品歸為一類為止。離差平方和法定義類間的平方距離為*其中是由Gp和Gq合併成的Gr類的類內離差平方和。可以證明離差平方和的聚類公式為*7、可變方法如果讓中間距離法的遞推公式前兩項的係數也依賴於?,則遞推公式為:用上式作為遞推公式的系統聚類法稱為可變法。*分別為Gp和Gq的重心,類與類之間的距離定義為兩個類重心(類內樣品平均值)間的平方距離。重心法,也稱為樣品的均值法。設Gp和Gq為兩個類8、重心法*設某一步Gp和Gq的重心分別為和,類內的樣品數分別為和,如果要把Gp和Gq合併為Gr類,則Gr類的樣品數nr=np+nq,Gr類的重心為和的加權算術平均數:*假設第p類和第q類合併成第類,第r類與其它各舊類的距離按重心法為:*二、確定類的個數在聚類分析過程中類的個數如何來確定才合適呢?這是一個十分困難的問題,人們至今仍未找到令人滿意的方法。但是這個問題又是不可回避的。下麵我們介紹幾種方法。1、給定閾值——通過觀測聚類圖,給出一個合適的閾值T。要求類與類之間的距離不要超過T值。例如我們給定T=0.35,當聚類時,類間的距離已經超過了0.35,則聚類結束。*總離差平方和的分解(準備知識)*如果著些樣品被分成兩類*可以證明:總離差平方和=組內離差平方和+組間離差平方和令T為總離差平方和令PG為分為G類的組內離差平方和。*2、統計量其中T是數據的總離差平方和,是組內離差平方和。比較大,說明分G個類時類內的離差平方和比較小,也就是說分G類是合適的。但是,分類越多,每個類的類內的離差平方和就越小,也就越大;所以我們只能取合適的G,使得足夠大,而G本身很小,隨著G的增加,的增幅不大。比如,假定分4類時,=0.8;下一次合併分3類時,下降了許多,=0.32,則分4類是合適的。*3、偽F統計量的定義為偽F統計量用於評價聚為G類的效果。如果聚類的效果好,類間的離差平方和相對於類內的離差平方和大,所以應該取偽F統計量較大而類數較小的聚類水準。*PseudoFStatistic0102030405060708090100110120NumberofClusters12345678910111213141516171819*4、偽統計量的定義為其中和分別是的類內離差平方和,是將K和L合併為第M類的離差平方和=--為合併導致的類內離差平方和的增量。用它評價合併第K和L類的效果,偽統計量大說明不應該合併這兩類,應該取合併前的水準。*三、系統聚類法的基本性質(一)單調性在聚類分析過程中,並類距離分別為lk(k=1,2,3,…?)若滿足,則稱該聚類方法具有單調性。可以證明除了重心法和中間距離法之外,其他的系統聚類法均滿足單調性的條件。(二)空間的濃縮和擴張1、定義矩陣的大小設同階矩陣D(A)和D(B),如果D(A)的每一個元素不小於D(B)的每一個元素,則記為。*2、空間的濃縮和擴張設有兩種系統聚類法A和B,他們在第i步的距離矩陣分別為Ai和Bi(I=1,2,3…),若AiBi,則稱第一種方法A比第二種方法B使空間擴張,或第二種方法比第一種方法濃縮。3、方法的比較D(短)D(平),D(重)D(平);D(長)D(平);當,D(變平)D(平);當,D(變平)D(平)
您可能关注的文档
最近下载
- 2025黑龙江哈尔滨“丁香人才周”(春季)民兵教练员专场招聘35人笔试备考题库及答案解析.docx VIP
- 2024年邵阳职业技术学院单招职业适应性测试题库及答案解析.docx VIP
- 武汉市人防工程登记表.doc
- 【公开课】Unit5MusicReadingandThinking课件-2021-2022学年高中英语人教版(2019)必修第二册.pptx VIP
- 2025年邵阳职业技术学院单招职业倾向性测试题库ab卷.docx VIP
- 糖尿病病人的护理查房.ppt
- 七年级下英语学探诊答案2022.pdf VIP
- 鼎信诺审计系统操作说明书 .pdf VIP
- 2025年广东省春季高考英语阅读五选五专项训练(含答案解析).pdf VIP
- 定岗定编操作实务.pptx VIP
文档评论(0)