《应用多元分析》第三版(第六章)综述.ppt

《应用多元分析》第三版(第六章)综述

1.给定一个阈值T 通过观测树形图,给出一个你认为合适的阈值T,要求类与类之间的距离要大于T,有些样品可能会因此而归不了类或只能自成一类。这种方法有较强的主观性,这是它的不足之处。 2.观测样品的散点图 如果样品只有两个或三个变量,则可通过观测数据的散点图来确定类的个数。对于三个变量,可使用SAS软件的交互式数据分析菜单系统通过旋转三维坐标轴从各个角度来观测散点图。 如果变量个数超过三个,则可对每一可能考虑的聚类结果分别使用费希尔判别法进行降维,将所有样品的前两个或三个判别式得分制作成散点图,观测类之间是否分离得较好以决定分几类较为合适。 从散点图中进行主观聚类 观测散点图还有一个重要的用途,就是从直觉上来判断所采用的聚类方法是否合理,甚至有时直接从散点图中进行主观的分类,效果也许会好于正规的聚类方法,特别是在寻找“自然的”类方面。 寻找“自然的”类 3.使用统计量 (1)R2统计量。 (2)半偏R2统计量。 (3)伪F统计量。 (4)伪t统计量。 §6.4 动态聚类法 动态聚类法的基本思想是,选择一批凝聚点或给出一个初始的分类,让样品按某种原则向凝聚点凝聚,对凝聚点进行不断的修改或迭代,直至分类比较合理或迭代稳定为止。类的个数k可以事先指定,也可以在聚类过程中确定。选择初始凝聚点(或给出初始分类)的一种简单方法是采用随机抽选(或随机分割)样品的方法。 动态聚类法有许多种方法,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档