Clementine中TwoStep模块的应用课件.ppt

统计分析、数据挖掘与商业智能应用研究小组 统计分析、数据挖掘与商业智能应用研究小组 Clementine中 TwoStep模块的应用 目 录 什么是Two Step Clementine与Two Step的关系 Clementine中的TwoStep模块应用介绍 什么是Two Step Clementine与Two Step的关系 Clementine中的TwoStep模块应用介绍 什么是Two Step Two Step概述 Two Step算法简介 Two Step概述 此处介绍的Two Step是二阶聚类算法(Two Step Cluster)的简写。 二阶聚类算法(Two Step Cluster)是一种分层聚类算法(Hierarchical Algorithms),目前多用于数据挖掘与多元统计的交叉领域,其算法适用于任何尺度的变量。 该算法主要处理非常大的数据,可自动确定类的数目,能够处理连续变量和分类变量的混合数据。 Two Step算法简介(1) Two Step算法是分前后两步进行的,也即“二阶”的意义所在。 第一步称为准聚类过程(Pre-cluster Step) 第二步进行具体的聚类分析 Two Step算法简介(2) 第一步:准聚类过程 这一步使用的是分层聚类中针对大样本聚类产生的BIRCH(Balance I

文档评论(0)

1亿VIP精品文档

相关文档