- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基本原理 聚类分析的分类 聚类分析在SPSS中的实现过程 分析例子 聚类分析分类 按分类对象不同:分为Q-型聚类分析(对样本分类)和R-型聚类分析(对指标或变量分类) 聚类分析分类 按分类方法不同:系统聚类法(分层聚类法-Hierarchical Cluster)将指标或样品各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的类加以合并。 动态聚类法(快速聚类分析或K-均值聚类法K-means Cluster)开始按照一定方法选取一批聚类中心,让样品向最近的聚心凝聚,形成初始分类,然后按最近距离原则不断修改不合理分类,直到合理为止。 * * 聚类分析 聚类分析 聚类分析的基本原理 科学研究在揭示对象特点及其相互作用的过程中, 需要对其进行分类 ,以揭示其中相同和不相同的特征。 在科学研究中, 经常遇到的分类包括两种情况: 一是对研究样本的分类, 即根据每个样本的一系列观测指标,将那些在这些观测量方面表现相近的样本归为一类, 将那些在这些观测量方面的表现很不相同的样本归为不同类。 二是对观测指标的分类,即将一系列的观测指标归类合并为性质明显不同的少数几个方面。 一、聚类分析的基本原理 聚类分析的基本原理 聚类分析是一种数值分类方法,直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。 聚类分析完全是根据数据情况来进行的。就一个由n个个案、k个变量组成的数据文件来说 ,当对个案进行聚类分析时,相当于对k 维坐标系中的n 个点进行分组,所依据的是它们的距离 ; 当对变量进行聚类分析时,相当于对n维坐标系中的k个点进行分组,所依据的也是点距。所以距离或相似性程度是聚类分析的基础。 点距如何计算呢?拿连续测量的变量来说,可以用欧氏距离平方计算:即各变量差值的平方和。 聚类分析的分类 聚类分析的分类 聚类分析的分类 二、Q聚类分析的SPSS过程 第一步:数据文件的准备。 聚类之前的数据文件包括:n个样本的k个观测值。 此外还需要一个样本的标识变量。 聚类分析前要检查各变量的量纲是否一致, 不一致则需进行转换, 如将各变量均作标准化转换就可保证量纲一致 Q型聚类分析在SPSS中的实现过程 第二步:点击“Analyze”菜单选中“Classify”的“Hierarchical Cluster Analysis”,打开对话框。将参与聚类分析的观测变量 置入“Variable(s)”下的方框中,将样本标识变量的变量名置 入 “Label Cases By” 下的方框中,同时在 Cluster 之下选择 Cases。然后选中“Statistics”和“Plots”。 Q型聚类分析在SPSS中的实现过程 第三步:点击“Method”打开聚类分析的距离计算方法设置对 话框 ,以实现对小类间距离 、样本间距离计算方法的设置 , 同时对量纲不一致情况下的变量观测值进行转换: (1) 小类间距离计算:默认方式是类间平均链锁法(Between- Groups linkage) ,这种方法最充分地使用了数据资料; (2) 样本间距离计算: 观测变量为连续变量,默认方法:欧氏距离平方; 观测变量为顺序或名义变量,默认方法:卡方测量方法; 观测变量为二项选择变量, 默认方法:二元欧氏距离平方。 (3) 如果观测变量的量纲不一致,还需设置对不同量纲变量进 标准化处理。默认状态是“none”,需要时可以选择“Z-scores”, 这是使用最广泛、最直观的转换方法 。在进行量纲转换时 , 要选择“By cases”表明是属于Q聚类分析中的量纲转换。 第四步:指定图形输出。层次聚类分析的图形结果有两种形 式(1)树形图(Dendrogram),它可以展现聚类分析的每一 次合并过程,SPSS首先将各类之间的距离重新转换到 0~25 之间 ,然后表现在图上 。此图可以粗略地表现聚类的过程 ; (2)冰柱图(Icicle), 包括纵向冰柱图(Vertical) 和横向 冰柱图(Horizontal) 。冰柱图用X符号来表示聚类过程 , 其选 择包括:全部、部分、无。 Q型聚类分析在SPSS中的实现过程 第五步:显示凝聚状态表。点击层次聚类分析对话框中的 “statistics”可以打开设置凝聚状态对话框。 (1) 选中“Agglomeration schedule”,可以输出聚类分析 详细过程,即每一阶段完成的是哪些个案或小类间的聚集; (2)
您可能关注的文档
- 唐驳虎中俄到底如何一步步讨价的最终谁赢了.doc
- 纳什博弈论案例.ppt
- 唐雎不辱使命(最后定稿)1(免费阅读).ppt
- 售后安全例会总结.ppt
- 唑虫酰胺Tolfenpyrad日本农药株式会社讲义0119,2010.ppt
- 售后4月半月分析.ppt
- 经济学第1章供求理论.ppt
- 售后服务流程(试用)120709.doc
- 售后服务顾问(SA)法则技巧注意事项.ppt
- 售楼处暖场活动集锦周末暖场必备.ppt
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
最近下载
- 中医诊所申请可行性报告.pptx VIP
- 凉山州布拖县考试招聘一村一幼辅导员考试试题及答案.pdf VIP
- 统编版语文四年级上册第三单元“连续观察”(主题阅读)含答案.pdf VIP
- 肺保护-胸外科.ppt VIP
- 巡视巡察领导自查报告问题清单.docx VIP
- 环境工程微生物-微生物生态.ppt VIP
- 2024下半年四川凉山州会理市招聘“一村一幼”辅导员56人笔试备考试题及答案解析.docx VIP
- 八年级上册因式分解练习200题及答案.docx VIP
- 2024四川凉山州美姑县教育体育和科学技术局考核招聘“一村一幼”辅导员340人笔试备考试题及答案解析.docx VIP
- 在全市党委系统信息工作会议上讲话党委会议.docx VIP
文档评论(0)