- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用标准文档
SPSS聚类分析:用于筛选聚类变量的一套方法
来源: 数据小兵
聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用 SPSS进
行聚类分析时,用于参与聚类的变量决定了聚类的结果,无关变量有时会引起严重的错分,
因此,筛选有效的聚类变量至关重要。
案例数据源:
在 SPSS自带数据文件 plastic.sav 中记录了 20 中塑料的三个特征,分别是 tear_res (抗
拉力)、 gloss (光滑度)、 opacity (透明度),相关经验表面这 20 中塑料可以分为 3 个
种类,如果用这三个变量进行聚类,请判断和筛选有效聚类变量。
一套筛选聚类变量的方法
一、盲选
将根据经验得到的、现有的备选聚类变量全部纳入模型,暂时不考虑某些变量是否不合适。
本案例采用 SPSS系统聚类方法。对话框如下 :
文案大全
实用标准文档
统计量选项卡:聚类成员选择单一方案,聚类数输入数字 3 ;
绘制选项卡:勾选树状图;
方法选项卡:默认选项,不进行标准化;
保存选项卡:聚类成员选择单一方案,聚类数输入数字 3 ;
二、初步聚类
这是盲选得到的初步聚类结果, 并且在数据视图我们可以看到已经自动生成了一个聚类结果
变量,这个变量非常有用。
文案大全
实用标准文档
三、方差分析
是不是每一个纳入模型的聚类变量都对聚类过程有贡献?利用已经生成的初步聚类结果, 我
们可以用一个单因素方差分析来判断分类结果在三个变量上的差异是否显著, 进而判断哪些
变量对聚类是没有贡献的。
文案大全
实用标准文档
分析——比较均值——单因素方差分析:
选项选项卡:勾选均值图
由方差分析我们很明确的得知, 纳入模型的三个聚类变量,其中只有“透明度”指标在各个
分类上有显著的差异, 也就是说分类有效果, 让每个分类的差异很大, 而两外两个变量则在
三个分类上没有显著差异,没有很好的类别区分度,所以,我们可以认为,这两个变量对聚
类无作用或者无贡献,可考虑踢出模型。
我们还想从可视化的角度来查看和判断, 单因素方差分析为我们提供了均值图, 可惜, 这三
个图却最容易误导我们的判断,因为 spss 在自动生产均值图时为每一个变量单独制图,而
且分配不同的纵轴坐标, 导致每个图看起来都有非常大的差异, 从视觉上迷惑我们做出错误
的判断。
文案大全
实用标准文档
这里需要改进!
四、均值描述
为改进以上 SPSS默认选项的不足之处,我们需要自己生成三个变量在不同类别上的均值,
means过程可以帮助到我们。
从数字上来看,抗拉力( 6.8 、6.7 、7.1 )、光滑度( 9.3 、9.4 、9.2 )两个指标在三个类别
上并没有多大的差异,而对聚类有贡献的透明度指标在不同类别上区分度非常明显。
文案大全
实用标准文档
五、多线均值图
克服纵轴刻度的方法是将这三个指标放在同一个坐标轴上进行对比, 也就是制作一个多线均
值图。
此时,结果已经一目了然了。
综上, 我们可以将抗拉力、 光滑度两个指标从模型中剔除, 只留下透明度一个指标再
原创力文档


文档评论(0)