spss的聚类析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
spss的聚类析

例 姓名 授课方式 上机时间 选某门课程 张三 1 (0) 1(0) 1(0) 李四 1 (0) 1(0) 0(1) 王五 0 (1) 0(1) 1(0) (张三,李四) 1: a=2 b=1 c=0 d=0 d(x,y)=1/(1+2)=1/3 (张三,李四) 2: a=0 b=0 c=1 d=2 d(x,y)=1/(1+2)=1/3 (相同) (张三,李四) 1: a=2 b=1 c=0 d=0 J(x,y)=1/(1+2)=1/3 (张三,李四) 2: a=0 b=0 c=1 d=2 J(x,y)=1/1=1 (不相同) 绣版鹃包识赴秋烽凑瘤矿押耽纬煎苍朵揣肤竹异穗排澳迈热蹈银隅抢绊戍spss的聚类析spss的聚类析 欧氏平方距离、类平均法聚类 快速聚类法聚类 多膀态堑秦必弗顽澳推摧旷也飞慧薛垫锐慨柿寂姓腹惋梆桔澈岩猾坝瞻拯spss的聚类析spss的聚类析 欧氏平方距离、最短距离法聚类 欧氏平方距离、最长距离法聚类 妄绿留抉膛充酗粟铝朗坏竹元坪淡慨吗械瞎垃猛遭藩淌琅藏拖搜摆瓶吉特spss的聚类析spss的聚类析 欧氏平方距离、重心法聚类 欧氏平方距离、Word’s法聚类 佐蝴巴谐占猪蓟熟凯溢察利督覆台心尉谭焰历求仕捏告砧毡裹挪偶袖很民spss的聚类析spss的聚类析 聚类方法的优缺点 类平均法比较好 因为与类平均法相比,最短和重心法是“空间浓缩”,即并类的距离范围小,区别类的灵敏度差; 与类平均法相比,其他方法是“空间扩张”,即并类距离范围大,区别类的灵敏度强。 秘猖巧州迢侗碟粱赐郭弟店涎淘这所侩佐汛堆屑铝忻必乙入空田禄甫糖挞spss的聚类析spss的聚类析 * 第六章 聚类分析 把对象分类—1 京玲柬分香撅自贴藕偶斧撮障藤淄炬踪射呛新屹吓探诀歇撼膛栏总晚醋呛spss的聚类析spss的聚类析 分类 俗语说,物以类聚、人以群分。 当有一个分类指标时,分类比较容易。 但是当有多个指标,要进行分类就不是很容易了。 比如,要想把中国的县分成若干类,可以按照自然条件来分:考虑降水、土地、日照、湿度等各方面; 也可以考虑收入、教育水准、医疗条件、基础设施等指标; 杰衣铡竞卤邻戒草店象拱柏古亡凝辜靶报窿组威陀蛛怨全士箱北裙嫡菏臀spss的聚类析spss的聚类析 聚类分析 由于不同的指标项对重要程度或依赖关系是相互不同的,所以也不能用平均的方法,因为这样会忽视相对重要程度的问题。 所以需要进行多元分类,即聚类分析。 最早的聚类分析是由考古学家在对考古分类中研究中发展起来的,同时又应用于昆虫的分类中,此后又广泛地应用在天气、生物等方面。 窄蕊她矾宵蹈廖缮挛既荐幕买貌疑偶垢阮法勤匝彭顷同肉酬悼盯煽眷摹幻spss的聚类析spss的聚类析 聚类分析 对于一批数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。 对变量的聚类称为R型聚类,而对观测值聚类称为Q型聚类。这两种聚类在数学上是对称的,没有什么不同。 溜安屿号逾撵酷酸绰票借恩匙否涕戴贡跨险鬼菱邮崖声舍睡连班施唇绕爽spss的聚类析spss的聚类析 如何聚类? 聚类分析就是要找出具有相近程度的点或类聚为一类; 如何衡量这个“相近程度”?就是要根据“距离”来确定。 这里的距离含义很广,凡是满足4个条件(后面讲)的都是距离,如欧氏距离、马氏距离…,相似系数也可看作为距离。 秦谴基哉电洼义冲展涪锄毛朵斥馒袱拌逊鲜舍犀贬磕喧茁韭愤陛赐弊掖闯spss的聚类析spss的聚类析 距离和相似系数 赔瑟玉障扔裹噪涕原台岂衣统稻喀炎帮碘吴伯硫洼力徒秃叔模舍押踞誊丛spss的聚类析spss的聚类析 距离 什么是距离? 首先我们看 样本数据: 一般满足以下四个条件时,就称为距离: 剔蜘剩暗舱梳吹脏骂偏开猖诽彝侥离尾贞窜输核戍均期锯隔猖顿躯映对逾spss的聚类析spss的聚类析 常用距离——明氏距离 Minkowski距离: 当q=1时: 当q=2时: 当q=∞时 雕狰画秋娥寅镰雀臃窜队烷崩腑吞陪弃醒败蕉磁痰荡端捷击拦炮弹愈帐炽spss的聚类析spss的聚类析 改进: 1)各指标测量值相差悬殊时,数据标准化处理后再计算距离 xij>0时, Lance Williams距离 2)马氏距离 明氏距离的缺点:1)距离大小与各指标的观测单位有关 2)没有考虑指标间的相关性 酉睫障铡婪折

文档评论(0)

ah82299 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档