第9章 Rapidminer-K-Means 聚类、辨别分析V1.docVIP

下载本文档

209
0
约8.57千字
约 16页
2018-05-02 发布于湖北
举报

第9章 Rapidminer-K-Means 聚类、辨别分析V1.doc

第9章 Rapidminer-K-Means 聚类、辨别分析V1

K-Means 聚类、辨别分析理解聚类分析餐饮企业经常会碰到这样的问题：如何通过餐饮客户消费行为的测量，进一步评判餐饮客户的价值和对餐饮客户进行细分，找到有价值的客户群和需关注的客户群？如何合理对菜品进行分析，以便区分哪些菜品畅销毛利又高，哪些菜品滞销毛利又低？餐饮企业遇到的这些问题，可以通过聚类分析解决。常用聚类分析算法与分类不同，聚类分析是在没有给定划分类别的情况下，根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同，聚类模型可以建立在无类标记的数据上，是一种非监督的学习算法。聚类的输入是一组未被标记的样本，聚类根据数据自身的距离或相似度将他们划分为若干组，划分的原则是组内样本最小化而组间（外部）距离最大化，如图91所示。图91 聚类分析建模原理常用聚类方法见表91。表91常用聚类方法类别包括的主要算法划分（分裂）方法 K-Means算法（K-平均）、K-MEDOIDS算法（K-中心点）、CLARANS算法（基于选择的算法）层次分析方法 BIRCH算法（平衡迭代规约和聚类）、CURE算法（代表点聚类）、CHAMELEON算法（动态模型）基于密度的方法 DBSCAN算法（基于高密度连接区域）、DENCLUE算法（密度分布函数）、OPTICS算法（对象排序识别）基于网格的方法 STING算法（

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第9章 Rapidminer-K-Means 聚类、辨别分析V1.docVIP