第11章聚类分析与判别分析摘要.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章聚类分析与判别分析摘要.ppt

6.Plots按钮 设置输出图形:树状图 冰状图 7.Method按钮 设置聚类分析的具体方法。 聚类方法: 组间连接:类间平均法 组内连接:类内平均法 最近临元素:最短距离法 最远临元素:最长距离法 质心聚类法:重心法 中位数聚类法:中位数法 Ward法:离差平方和法 8.Save按钮 设置需要保存的分析结果。 输出结果的统计分析 凝聚状态表: 成员表 水平冰柱图 树状图 Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 山西 4 -+ 江西 14 -+-+ 内蒙 5 -+ +-------+ 吉林 7 -+ | | 黑龙江 8 -+-+ | 安徽 12 -+ +---------------+ 湖北 17 -+ | | 湖南 18 -+-----+ | | 四川 22 -+ +---+ | 河北 3 -+-+ | +---------------------+ 河南 16 -+ +---+ | | 辽宁 6 ---+ | | 青海 28 -+ | | 11.6.2 动态聚类法的SPSS实现 在SPSS中,凝聚点的指定不是必须的,系统会自动根据分类数目,结合样品情况来选取凝聚点。 形成初始分类的方法通常有两种,一是直接将每个样品按与其距离最近的凝聚点并类,二是先让每个凝聚点自成一类,将样品依此并入与其距离最近的凝聚点的一类,并计算该类的重心,以这个重心代替原来的凝聚点,再考虑下一个样品的并类,直至所有样品都归类为止。 操作: 【分析(Analyze)】→【 分类(Classify)】→【k-均值聚类(K–Means Cluster)】打开k-均值聚类分析(K–Means Cluster Analysis)对话框 变量列表框 : 聚类数(Number of Clusters)输入框输入指定的聚类数目。 1.迭代(Iterate)按钮 设置快速聚类的迭代终止条件。 2.保存(Save)按钮 设置需要保存的分析结果。 3.选项(Options)按钮 选择快速聚类的输出结果,并指定对缺失数据的处理方法。 输出结果的统计分析 凝聚点表 最后类中心表 类间距离表 分类表 每类中包含的样品数 第十一章SPSS的聚类分析 11.1聚类分析的一般问题 11.1.1聚类分析的意义 聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析在统计分析的应用领域已经得到了极为广泛的应用。 理解聚类分析的关键是理解何谓“没有先验知识”以及“亲疏程度”。所谓“没有先验知识”是指没有事先指定分类标准;所谓“亲疏程度”是指在各变量(特征)取值上的总体差异程度。聚类分析正是基于此实现数据的自动分类的。 11.1.2聚类分析中“亲疏程度”的度量方法 聚类分析中,个体之间的“亲疏程度”是极为重要的,它将直接影响最终的聚类结果。对“亲疏程度”的测度一般有两个角度:第一,个体间的相似程度;第二,个体间的差异程度。衡量个体间的相似程度通常可采用简单相关系数或等级相关系数等。个体间差异程度通常通过某种距离来测度,这里将对此做重点讨论。 为定义个体间的距离应先将每个样本数据看成k维空间上的一个点。通常,点与点之间的距离越小,意味着它们越“亲密”,越有可能聚成一类。点与点之间的距离越大,意味着它们越“疏远”,越有可能分别属于不同的类。 11.1.2.1定距型变量个体间距离的计算

文档评论(0)

love + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档