- 1、本文档共86页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
系統聚類分析的基本思想
和分析步驟(一)基本思想系統聚類分析(HierachicalC1usterAnalysis)是在樣品距離的基礎上,定義類與類之間的距離,首先將個樣品自成一類,然後每次將具有最小距離的兩類合併,合併後重新計算類與類之間的距離,這個過程一直繼續到所有樣品歸為一類為止,並把這個過程做成一個聚類譜系圖。這種方法即系統聚類分析。系統聚類分析的基本思想是:把n個樣品看成p維(p個指標)空間的點,而把每個變數看成p維空間的坐標軸,根據空間上點與點的距離來進行分類。系統聚類分析的具體方法是:將n個樣品自成一類,先計算n(n-1)/2個相似性測度或距離,並且把具有最小測度的兩個樣品合併成兩個元素的類,然後按照某種聚類方法計算這個類和其餘(n-2)個樣品之間的距離,這樣一直持續下去,並類過程中,每一步所做的並類(樣品與樣品,樣品與類、類與類)都要使測度在系統中保持最小,每次減少一類,直到所有樣品都歸為一類為止。(二)系統聚類分析的一般步驟1、對數據進行變換處理;2、計算各樣品之間的距離,並將距離最近的兩個樣品合併成一類;3、選擇並計算類與類之間的距離,並將距離最近的兩類合併,如果類的個數大於1,則繼續並類,直至所有樣品歸為一類為止;4、最後繪製系統聚類譜系圖,按不同的分類標準或不同的分類原則,得出不同的分類結果;常用系統聚類分析方法進行聚類分析時,由於對類與類之間的距離的定義和理解不同,並類的過程中又會產生不同的聚類方法。常用的系統聚類方法有8種。即最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法、離差平方和法等。儘管系統聚類分析方法很多,但每種方法的歸類步驟基本是一樣的,所不同的主要是對類與類之間的距離的定義不同。用最短距離法的聚類主要步驟如下:(二)最長距離法最長距離法與最短距離法在並類步驟上是完全一致的,而是在定義類與類之間的距離是相反的,類與類之間的距離定義為兩類之間所有樣品間距離最大者,(三)中間距離法(Gower,1966年)該法是在定義類與類之間的距離時,既不採用兩類樣品之間的最近距離,也不採用兩類樣品之間最遠距離,而是採用介於兩者之間的中間距離,具體分類過程與前面最短和最長距離分類方法步驟相同,只是在定義的距離為中間距離。(四)重心法以上三種方法在定義類與類之間距離時,沒有考慮每一類所包含的樣品數。因此,在定義類與類的距離時,把每一類中所包括的樣品數目也考慮進去,把兩個類重心之間的距離定義為類與類的距離,用這種距離分類的方法就稱為重心法。所謂每一類的重心就是該類樣品的均值。其中單個樣品的重心就是它本身,兩個樣品的類的重心就是兩點連線的中點。重心法的歸類步驟與以上三種方法基本一樣,所不同的是每合併一次類,就要重新計算一次新類的重心以及與與其他各類的距離。(五)類平均法該方法定義類與類的距離時,不僅把每一類中所包括的樣品數目考慮進來,而且把各樣品的資訊都充分地考慮進來,而把兩個類之間的距離平方定義為兩類元素兩兩之間距離平方的平均。(六)可變類平均法(七)可變法(八)離差平方和法(Ward法)基本思想是,基於方差分析的思想,如果類分得合理,則同類樣品之間離差平方和應當較小,類與類之間的離差平方和應當較大。Ward方法的基本思想是將兩類合併後所增加的離差平方和看成類之間的距離,先將n個樣品各自成一類,然後每次縮小一類,每縮小一次離差平方和就會增加,選擇使S增加最小的兩類合併,直到所有的樣品歸為一類為止。實際應用中,離差平方和法應用比較廣泛,分類效果比較好。離差平方和法要求樣品之間的距離必須是歐氏距離。系統聚類分析方法的統一公式由於上述聚類方法的合併類原則和步驟是完全一樣的,所不同的是類與類之間的距離公式有不同的定義,所以可得到不同的遞推公式。1969年維希特提出了統一的公式,這為編制統一的電腦程式提供了極大的方便性。具體公式為:系統聚類分析方法的性質1、關於並類時距離的單調性設是系統聚類法中第次並類時的距離,如果則稱並類距離具有單調性。經過證明最短距離法、最長距離法、類平均法、離差平方和法、可變法和可變類平均法都具有單調性,只有重心法和中間距離法不具有單調性。具有單調性畫出的聚類圖符合系統聚類的思想,先並類的類關係較近,後並類的類關係較遠。2、關於兩種聚類方法之間距離矩陣的比較:空間擴張、空間收縮由於作系統聚類圖的時候,橫坐標(並
您可能关注的文档
- 颈部与喉断层解剖课件.ppt
- 颈部与喉断层解剖课件.ppt
- 局部解剖学课件.ppt
- 聚类分析课件.ppt
- 眶与鼻断层解剖课件.ppt
- 眶与鼻断层解剖课件.ppt
- 流行性腮腺炎课件.ppt
- 流行性腮腺炎课件.ppt
- 颅脑断层解剖课件.ppt
- 轮状病毒肠炎课件.ppt
- 公司各级全员安全生产责任制考核记录(汇总表).doc
- 人教版三年级下册音乐《伦敦德里小调》说课稿.docx
- 人教版三年级下册音乐《威风堂堂进行曲》说课稿.docx
- 人教版七年级数学下册8.2.2.1《加减消元法(1)》说课稿.docx
- 人教版三_四年级体育与健康《4.2.3.2侧向助跑跳高》教学设计.docx
- 人教版七年级数学下册8.2.1.2《代入消元法(2)》教学设计.docx
- 人教版三年级上册数学《分数的简单计算》公开课教学设计.docx
- 引导学生培养阅读兴趣-中小学四年级阅读兴趣.pptx
- 英语启蒙:幼儿园篇-搭建孩子英语学习的基石.pptx
- 打造出色的排版布局-排版设计师或教师的指南.pptx
最近下载
- C++程序设计教程教学设计-初识C++教学设计.pdf VIP
- 邮政普遍服务标准.doc
- 2025年长沙商贸旅游职业技术学院单招职业技能测试题库精编答案.docx VIP
- 多关节机械手在晶圆减薄机中的应用 multi-articular robot application in back grinding machine.pdf VIP
- (正式版)SH-T 3145-2024 石油化工特殊用途汽轮机工程技术规范.pdf VIP
- 贵州省2025年初中物理学业水平考试(中考)模拟卷(一)(有答案).docx VIP
- 电力电子课程设计三相桥式SPWM逆变电路的设计及仿真.doc VIP
- 数字经济学教学课件.pptx VIP
- 小学科技制作活动教案 五下科技制作教案.doc
- 食品加工机械与设备.pptx VIP
文档评论(0)