聚类分析快速聚类分析课件.pptVIP

下载本文档

269
0
约1.54千字
约 14页
2017-01-03 发布于重庆
举报

聚类分析快速聚类分析课件.ppt

快速聚类分析（K-Means聚类分析） 2011级分析化学硕士研究生左伟伟快速样本聚类的基本概念：当要聚成的类数已知时，使用快速聚类过程可以很快将观测量分到各类中去，其特点是处理速度快，占用内存少。 K-Means Cluster执行快速样本聚类，使用K均值分类法对观测量进行聚类。可以完全使用系统默认值执行该命令，也可以对聚类过程设置各种参数进行人为的干预。例如，可以事先指定把数据文件的观测量分为几类：指定是聚类过程中止的判据，或迭代次数等。快速聚类适用于大样本的聚类分析，它能快速的把个观测量分到各类中去。进行快速样本聚类首先要选择用于聚类分析的变量和类数。参与聚类分析的变量必须是数值型变量，且至少要有一个。为了清楚地表明各观察量最后聚到哪一类，还应该指定一个表明观测量特征的变量作为标识变量，例如编号、姓名之类的变量。聚类必须大于等于2，但是聚类数不能大于数据文件中的观测数。如果选择了n个数值型变量参与聚类分析，最后要求聚类数为k。那么可以由系统首先选择k个观测量（也可以由用户指定）作为聚类的种子，n个变量组成n维空间。每个观测量在n维空间中是个点。K个事先指定的观测量就是k个聚类中心点，也称为初始类中心。按照距这几个类中心的距离最小原则把

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

聚类分析快速聚类分析课件.pptVIP