聚类实验介绍.docVIP

  • 13
  • 0
  • 约1.38千字
  • 约 7页
  • 2016-05-09 发布于湖北
  • 举报
福州大学数学与计算机科学学院 上机实验报告 专业:信息与计算科学 学号 031201206 姓名 詹小青 班级 02班 实验名称 聚类分析实验 实验主要内容 SPSS的聚类分析 实 验 目 的 和 要 求 实验: 系统聚类法将模式样本按距离准则逐步分类,类别由多到少,直到获得合适的分类要求为止。算法步骤:第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类,。计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为逐次聚类合并的次数,则求D(n)中的最小元素。如果它是Gi(n)和Gj(n)两类之间的距离,则将Gi(n)和Gj(n)两类合并为一类,由此建立新的分类:。第三步:计算合并后新类别之间的距离,得D(n+1)。 计算与其它没有发生合并的之间的距离,可采用多种不同的距离计算准则进行计算。第四步:返回第二步,重复计算及合并,直到得到满意的分类结果。(如:达到所需的聚类数目,或D(n)中的最小分量超过给定阈值D等。) 将给定的样本划分为K类,K预先指定。算法基本思想:基于使聚类性能指标最小化,所用的聚类准则函数是聚类集中每一个样本点到该类中心的距离平方之和,并使其最小化。算法步骤:为每个聚类确定一个初始聚类中心,这样,就有K个初始聚类中心将样本集中的样本Xi按照最小距离原则分配到最邻近聚类Zj?;第三步,使用每个聚类中的样本均值作为新的聚类中心重复步骤2.3直到聚类中心不再变化结束,得到K个聚类。 张三 99 98 王五 88 89 赵四 79 80 小杨 89 78 蓝天 75 78 小白 60 65 李之 79 87 马武 75 76 郭炎 60 56 刘小 100 100 实 验 内 容 和 步 骤 实验步骤: 1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示: 2.在Data View中先输入数据,结果如下图所示: 3. 首先试用系统聚类法对相关数据进行聚类; 4. 选择菜单:【Analyze】→【Classify】→【Hierarchical Cluster】,然后选择参与层次聚类分析的变量两次语文考试的成绩到【Variable(s)】框中,再选择一个字符型变量“人名”作为标记变量到【Label Cases by】框中; 5.按“Plots”后进行选择; 6.按“Statistics”后进行选择; 7.按“Method”后进行选择; 8.对第一个表格进行保存,并且命名为“语文水平.sav”,同时保存输出结果。 系统聚类法输出结果: K-均值法输出结果: 研 究 与 探 讨 迅速评价聚类结果,在上述迭代运算中是很重要的,特别是具有高维特征向量的模式,不能直接看清聚类效果,因此,可考虑用以下几个指标来评价聚类效果: 聚类中心之间的距离距离值大,通常可考虑分为不同类聚类域中的样本数目样本数目少且聚类中心距离远,可考虑是否为噪声聚类域内样本的距离方差方差过大的样本可考虑是否属于这一类模式聚类目前还没有一种通用的放之四海而皆准的准则,往往需要根据实际应用来选择合适的方法。

文档评论(0)

1亿VIP精品文档

相关文档