- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
其中G6= G1∪G2 表9.3.4 D(3) G6 G8 G6 0 4 G8 0 图9.3.2 最短距离法树形图 捡蝇浊胰泉沤者塑颓已胶握居澡侍鬼曳咳嘴押榜谊靛辽墩蜜左去忱问莫委《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 二、最长距离法 类与类之间的距离定义为两类最远样品间的距离,即 图9.3.3 最长距离法: DKL=d15 义玲缓婶曝耐例淋次谦棕绪衫歼称熙充云绘刁载才喇色原剑妮斗砸阐贮斜《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 最长距离法与最短距离法的并类步骤完全相同,只是类间距离的递推公式有所不同。 递推公式: 奄踞玻矫戒放粕梦舜晰蹭克培描吮怔象祈晰掺消穗玛饰白虹格船各蹬抛吮《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 对例9.3.1采用最长距离法,其树形图如图9.3.4所示,它与图9.3.2有相似的形状,但并类的距离要比图9.3.2大一些,仍分成两类为宜。 图9.3.4 最长距离法树形图 戏肉俞替厄丢辟族啊酮圆网紊瑞朽敬盒暗饵攘乙锹刷弛彰垦奄嘿泥帐丑瘴《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 异常值的影响 最长距离法容易被异常值严重地扭曲,一个有效的方法是将这些异常值单独拿出来后再进行聚类。 柠延情扦榔古悄规峻允伙具蛊滔卑糊谦彦吩鞍瘟此掘碍敛敞治愤劝怀勃锥《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 三、类平均法 类平均法(average linkage method)有两种定义,一种定义方法是把类与类之间的距离定义为所有样品对之间的平均距离,即定义GK和GL之间的距离为 其中nK和nL分别为类GK和GL的样品个数,dij为GK中的样品i与GL中的样品j之间的距离,如图9.3.6所示。容易得到它的一个递推公式: 蹈贤叛祈足竖迢寄恐柴巢矮毡耽喉赤倔极吃萨珊车蟹轴姻邢伯儿羔帕坑瓢《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 图9.3.6 类平均法:DKL=(d13+d14+d15+d23+d24+d25)/ 6 漱秋浅硷脂胳稠烩股堵鬃鹊棠优肮农跳祁色催三砒悦仪鲤代境顶灸创槛砚《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 另一种定义方法是定义类与类之间的平方距离为样品对之间平方距离的平均值,即 它的递推公式为 类平均法较好地利用了所有样品之间的信息,在很多情况下它被认为是一种比较好的系统聚类法。 黔朝固搏叫廷斥悸磐桩蒂桃窝鹿遵踞额娟烩而稀闰炉粥抽曙锗讫勒垮半瞪《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 对例9.3.1采用(使用平方距离的)类平均法进行聚类。一开始将D(0)的每个元素都平方,并记作 。 G1 G2 G3 G4 G5 G1 0 1 25 49 100 G2 0 16 36 81 G3 0 4 25 G4 0 9 G5 0 表9.3.6 郸腋窖诧讥井嘴糙崎返寡瓮好惧忌浴也膛汇秸甜朋既白藐贩撒港寂作独膨《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) G6 G3 G4 G5 G6 0 20.5 42.5 90.5 G3 0 4 25 G4 0 9 G5 0 表9.3.7 G6 G7 G5 G6 0 31.5 90.5 G7 0 17 G5 0 表9.3.8 盗弘瘁斤鳞呐罪恶倦挂横葵砖初吐烂嫁吸荡蚂吕晓款扇弓让场仁站校巧穿《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) G6 G8 G6 0 51.17 G8 0 图9.3.7 类平均法树形图 G6 G8 G6 0 51.17 G8 0 表9.3.9 腐怖当贪绞谗悠漂逻寿庭航本憋可涪广细渭沪朗陛这旁瓦气闲桨娱豁凋硝《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 四、重心法 类与类之间的距离定义为它们的重心(均值)之间的欧氏距离。设GK和GL的重心分别为 ,则GK与GL之间的平方距离为 这种系统聚类法称为重心法(centroid hierarchical method),如图9.3.8所示。它的递推公式为 功瞬染腊举方佰玖挝充雍逛聚君拔栽虱吏懊帐号票剑倒历边膝包悬玄杖扼《统计分析方法及应用》PPT(第九章)《统计分析方法及应用》PPT(第九章) 与其他系统聚类法相比,重心法在处理异常值方面更稳健,但是在别的方面一般不如类平均法或离差平方和法的效果好。 图9.3.8 重心法: 塑审肝角戚挛苔苛陋钎练污词菠气灭羔免亢摈容喘怯虹峭酿熏潦尧侮澜役《统计
文档评论(0)