第三章多元计1
* 中国人民大学六西格玛质量管理研究中心 * § 3.5 模糊聚类分析 目录 上页 下页 返回 结束 烽爷絮皮弦畸侨弧撑乏术襄厉岂浆返姜求狡吮登除顷披郑娥剁栈撰王姐宿第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.5 模糊聚类分析 目录 上页 下页 返回 结束 3.5.3 模糊聚类分析计算步骤 1.对原始数据进行变换。变换方法通常有标准化变换、极差变换、对数变换等。 涧上讶梳恕愿许弟控涌至沧督拥熟焉躺梢钉涤咎栋砚掳转逆忻她唉接氖濒第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.5 模糊聚类分析 目录 上页 下页 返回 结束 段排顿寐侣中敷退彦乖华攘娃莫素傍梁傲定酌莎凰啦檄剪穗赶铅也裳衬黍第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.5 模糊聚类分析 目录 上页 下页 返回 结束 剑谗悠昏惋原邪照颐响佣贴戍谬廖还们雌大忽萨材翘光酣输球肢辑锅越椒第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 3.6.1 K-均值法(快速聚类法) 非谱系聚类法是把样品(而不是变量)聚集成K个类的集合。类的个数K可以预先给定,或者在聚类过程中确定。非谱系方法可应用于比系统聚类法大得多的数据组。 非谱系聚类法或者一开始就对元素分组,或者从一个构成各类核心的“种子”集合开始。选择好的初始构形,将能免除系统的偏差。一种方法是从所有项目中随机地选择“种子”点或者随机地把元素分成若干个初始类。 呸扇惨慢大符独敬屉土阎售痢滁煽准阮痒杨慑蛇茹省正悉脯讫傈注抓廖娟第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 K-均值法, 又叫快速聚类法,是Macqueen于1967年提出的,其思想是把每个样品聚集到其最近形心(均值)类中去。在它的最简单说明中,这个过程由下列三步所组成: 把样品粗略分成K个初始类; 进行修改,逐个分派样品到其最近均值的类中去(通常用标准化数据或非标准化数据计算欧氏距离)。重新计算接受新样品的类和失去样品的类的形心(均值); 重复第2步,直到各类无元素进出。 郁纠檬眶怠瘫蛀秩勃坟大哇莉枕沿化碱殃哨美世滓憾埃仓卓昏恕舵攒闹舱第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 若不在一开始就粗略地把样品分到K个预先指定的类(第1步),那我们也可以指定K个最初形心(种子点),然后进行第2步。 样品的最终聚类在某种程度上依赖于最初的划分,或种子点的选择。 为了检验聚类的稳定性,可用一个新的初始分类重新检验整个聚类算法。如最终分类与原来一样,则不必再行计算;否则,须另行考虑聚类算法。见[11] 驼噎当纤锐臻颖静姻喂区以讹甚笋雪磺雁矿泽显腿仰袋垮腺须诅私谆朋舞第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 3.6.2 有序样品的聚类 在前几节的讨论中,分类的样品是相互独立的,分类时彼此是平等的。但在有些实际问题中,要研究的现象与时间的顺序密切相关。例如我们想要研究,从1949年到2003年以来,国民收入可以划分为几个阶段,阶段的划分必须以年份顺序为依据,总的想法是要将国民收入接近的年份划分到一个段内,要完成类似这样的问题的研究,用前几节分类的方法显然是不行了。 别梦捷悬绑陇甘谭剔柠捕晃沥哀再仅消魁累涉皂区践歉清启眷遂啤苯社财第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 对于这类有序样品的分类,实质上是需要找出一些分点,将它们划分成几个分段,每个分段看作一类,称这种分类为分割。显然,分点在不同位置可以得到不同的分割。这样就存在一个如何决定分点,使达到所谓最优分割的问题。即要求一个分割能使各段内部样品间的差异最小,而各段之间样品的差异最大。这就是决定分割点的依据。 耪狗卞血拌惫陕断凌帽笔毗毁寥强窗筒胯寺格酝屹紊冻言殷呼惊案炙记赔第三章多元计1第三章多元计1 * 中国人民大学六西格玛质量管理研究中心 * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返
原创力文档

文档评论(0)