- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss聚类分析解析加具体案例例子
六、聚类分析
(一)概述
1.聚类分析的目的
根据已知数据,计算样本或者变量之间亲疏关系的统计量 (距离或相关系数)。
根据某种准则 (最短距离法、最长距离法、中间距离法、重心法),使同一类内
的差别较小,而类与类之间的差别较大,最初达到的就是将样本或变量分成若干
类。
2.聚类分析的分类
划分标准 名称 概述 优缺点
分类的对象 Q-型聚类 对样本进行分类
R-型聚类 对变量进行分类
分类的原理 系统聚类 将一定数量的样本或指标看 优点:限制少,不需要
成一类,根据亲疏程度,将 预先给出聚类数目;可
亲疏程度最高的合并,然后 发现层次关系
考虑合并后的类与其它类的 缺点:复杂度高,异常
亲疏程度,再合并,不断重 值也会产生影响;
复这个过程,直到将所有样
本合成一类。
快速聚类 要求给出需要聚成多少类, 优点:快速高效;复杂
再让样本凝聚,形成初始分 度低
类,然后再按照最近距离原
则修改不合理的分类,直到 缺点:需要积累一定的
合理为止 实践经验(给出聚类的
数目);较大的异常值
会产生很大影响 (对异
常值敏感)
3.距离与相似性
为了对样本或者变量进行分类,就需要研究样本之间的关系,最常用的方法有两
个。
方法 分类 分类概述
相似系数(性质越接近的 夹角余弦 等于 1 说明两个样本完
样本,相似系数的绝对值 全相似;接近1 说明相似
越接近于1,而无关的样 密切;等于0 说明完全不
本相似系数的绝对值越 一样;接近0 说明差别大
接近0 ) 相关系数 变量间的相关系数
距离(将样本看作空间的 明氏距离
一个点,并在空间定义距 马氏距离 排除了变量间相关性的
离,距离近的归为一类, 干扰
距离远的归为不同类) 兰氏距离 使用于一切情况,但没有
考虑变量之间的相关性
(二)系统聚类
1.系统聚类的步骤
距离的具体定义及计算方式
计算n 各样本两两之间的距离
将距离接近的数据依次合并为一类,再计算,再合并
画聚类图,解释类与类之间的关系
2.亲疏程度度量方法
名称 描述
您可能关注的文档
- excel函数应用运用500例.doc
- fpga技术教程教本(通俗易懂).ppt
- ghost整个硬盘备份恢复图文教程教本.docx
- ict技术概述概要.pptx
- ie工业工程实战_ppt.ppt
- iot关键技术跟应用运用-20180615.ppt
- java语言基础教程教本.doc
- k3信用管理设置跟应用运用浅谈.pdf
- k13产业政策跟用户体验牵引千兆光网络快速部署.pdf
- keep运营案例例子分享.ppt
- 浙江金华市公共资源交易中心永康市分中心编外人员招考聘用笔试历年典型考题及考点研判与答案详解.docx
- 浙江宁波慈溪市政协办公室招考聘用编外工作人员笔试历年典型考题及考点研判与答案详解.docx
- 浙江金华永康市西溪镇人民政府招考聘用笔试历年典型考题及考点研判与答案详解.docx
- 福建南平市公安局建阳分局招考聘用辅警笔试历年典型考题及考点研判与答案详解.docx
- 浙江嘉兴海盐县武原街道基层残疾人工作专职委员(公益岗位)招考聘用笔试历年典型考题及考点研判与答案详解.docx
- 浙江宁波知识产权保护中心招考聘用工作人员笔试历年典型考题及考点研判与答案详解.docx
- 浙江杭州建德市面向2024届普通高校毕业生招考聘用教师(第二批)16人笔试历年典型考题及考点研判与答案详解.docx
- 浙江省台州中学面向2024届普通高校毕业生招考聘用教师12人笔试历年典型考题及考点研判与答案详解.docx
- 湖北师范大学体育学院专任教师招考聘用笔试历年典型考题及考点研判与答案详解.docx
- 重庆市南岸区教育事业单位面向2024届高校毕业生招考聘用114人笔试历年典型考题及考点研判与答案详解.docx
文档评论(0)