聚类分析原理及步骤.docVIP

  • 187
  • 0
  • 约1.94千字
  • 约 5页
  • 2016-02-29 发布于江苏
  • 举报
聚类分析原理及步骤.doc

聚类分析原理及步骤 ——将未知数据按相似程度分类到不同的类或簇的过程 传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。 典型应用 动植物分类和对基因进行分类 在网上进行文档归类来修复信息 帮助电子商务的用户了解自己的客户,向客户提供更合适 的服务 主要步骤 数据预处理选择数量,类型和特征的标度特征选择和抽取“维数灾”进行聚类)和将孤立点移出数据(孤立点是不依附于一般数据行为或模型的数据为衡量数据点间的相似度定义一个距离函数Euclidean距离,经常被用作反映不同数据间的相异性,一些有关相似性的度量,例如PMC和SMC,能够被用来特征化不同数据的概念相似性,在图像聚类上,子图图像的误差更正能够被用来衡量两个图形的相似性 聚类或分组Crisp Clustering和Fuzzy Clusterin是划分方法的两个主要技术,Crisp Clustering,它的每一个数据都属于单独的类;Fuzzy Clustering,它的每个数据可能在任何一个类中)和层次方法(基于某个标准产生一个嵌套的划分系列,它可以度量不同类之间的相似性或一个类的可分离性用来合并和分裂类)是聚类分析的两个主要方法,另外还有基于密度的聚类,基

文档评论(0)

1亿VIP精品文档

相关文档