第11章聚类分析与判别分析摘要.ppt

下载文档 降价啦

16
0
约 50页
2016-03-12 发布于湖北
举报
版权申诉
保障服务

第11章聚类分析与判别分析摘要.ppt

1、本文档共50页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第11章聚类分析与判别分析摘要.ppt

6．Plots按钮设置输出图形：树状图冰状图 7．Method按钮设置聚类分析的具体方法。聚类方法：组间连接：类间平均法组内连接：类内平均法最近临元素：最短距离法最远临元素：最长距离法质心聚类法：重心法中位数聚类法：中位数法 Ward法：离差平方和法 8．Save按钮设置需要保存的分析结果。输出结果的统计分析凝聚状态表: 成员表水平冰柱图树状图 Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 山西 4 -+ 江西 14 -+-+ 内蒙 5 -+ +-------+ 吉林 7 -+ | | 黑龙江 8 -+-+ | 安徽 12 -+ +---------------+ 湖北 17 -+ | | 湖南 18 -+-----+ | | 四川 22 -+ +---+ | 河北 3 -+-+ | +---------------------+ 河南 16 -+ +---+ | | 辽宁 6 ---+ | | 青海 28 -+ | | 11.6.2 动态聚类法的SPSS实现在SPSS中，凝聚点的指定不是必须的，系统会自动根据分类数目，结合样品情况来选取凝聚点。形成初始分类的方法通常有两种，一是直接将每个样品按与其距离最近的凝聚点并类，二是先让每个凝聚点自成一类，将样品依此并入与其距离最近的凝聚点的一类，并计算该类的重心，以这个重心代替原来的凝聚点，再考虑下一个样品的并类，直至所有样品都归类为止。操作：【分析（Analyze）】→【分类（Classify）】→【k-均值聚类（K–Means Cluster）】打开k-均值聚类分析（K–Means Cluster Analysis）对话框变量列表框：聚类数（Number of Clusters）输入框输入指定的聚类数目。 1．迭代（Iterate）按钮设置快速聚类的迭代终止条件。 2．保存（Save）按钮设置需要保存的分析结果。 3．选项（Options）按钮选择快速聚类的输出结果，并指定对缺失数据的处理方法。输出结果的统计分析凝聚点表最后类中心表类间距离表分类表每类中包含的样品数第十一章SPSS的聚类分析 11.1聚类分析的一般问题 11.1.1聚类分析的意义聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析在统计分析的应用领域已经得到了极为广泛的应用。理解聚类分析的关键是理解何谓“没有先验知识”以及“亲疏程度”。所谓“没有先验知识”是指没有事先指定分类标准；所谓“亲疏程度”是指在各变量（特征）取值上的总体差异程度。聚类分析正是基于此实现数据的自动分类的。 11.1.2聚类分析中“亲疏程度”的度量方法聚类分析中，个体之间的“亲疏程度”是极为重要的，它将直接影响最终的聚类结果。对“亲疏程度”的测度一般有两个角度：第一，个体间的相似程度；第二，个体间的差异程度。衡量个体间的相似程度通常可采用简单相关系数或等级相关系数等。个体间差异程度通常通过某种距离来测度，这里将对此做重点讨论。为定义个体间的距离应先将每个样本数据看成k维空间上的一个点。通常，点与点之间的距离越小，意味着它们越“亲密”，越有可能聚成一类。点与点之间的距离越大，意味着它们越“疏远”，越有可能分别属于不同的类。 11.1.2.1定距型变量个体间距离的计算