聚类分析的案例分析.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《应用多元统计分析》 ——报告 班级: 学号: 姓名: 聚类分析的案例分析 摘要 本文主要用 SPSS 软件对实验数据运用系统聚类法和 K 均值聚类法进行聚类分 析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的 气体浓度的情况,从而判断出这几个地区的污染程度。 经过聚类分析可以得到,样本 6 这一地区的气体浓度值最高,污染程度是最严 重的,样本 3 和样本 4 气体浓度较高,污染程度也比较严重,因此要给予及时的 控制和改善。 关键词:SPSS 软件 聚类分析 学生成绩 一、数学模型 聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的 相似性。可以根据这些相似性把相似程度较高的归为一类,从而对其总体进行分 析和总结,判断其之间的差距。 系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之 间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根 据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较 为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们 用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。 K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。 二、数据来源 《应用多元统计分析》第一版164 页第 6 题 我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的 8 个大气取样点,在固定的时间点每日 4 次抽取 6 种大气样本,测定其中包含的 8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及 大气污染气体进行分类。 1 三、建立数学模型 一、运行过程 (一)系统聚类分析 在 SPSS 界面对上述数据进行系统聚类分析如图 1 和图 2 所示,进行最近距离 分类。 图 1 2 图2 (二)K 均值聚类分析 对数据进行 K 均值聚类分析,如下图所示: 图 3 3 图4 图 5 二、运行结果 (一)聚类树形图 4 图6 由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。若分为 两类则样本 6 为一类,其他为一类;若分为三类则将样本四分离出来,其他分为 一类。 (二)新变量 图 7 5 该图显示将分类结果的新变量,分别为 CLU3_1 和 CLU2_1。可以清楚的看到将 数据聚为 2 类和 3 类的分类情况。

文档评论(0)

137****0427 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档