第七章模糊聚类分析.pptVIP

  • 4
  • 0
  • 约3.36千字
  • 约 34页
  • 2025-10-19 发布于广东
  • 举报

第1页,共34页,星期日,2025年,2月5日一、模糊聚类分析聚类分析:按照一定要求和原则对事物进行分类。聚类:普通分类——清晰事物模糊分类——带有模糊性的事物三种模糊聚类方法:传递闭包法——基于模糊等价关系;直接聚类法——基于模糊相似关系;模糊聚类法——基于模糊划分.第2页,共34页,星期日,2025年,2月5日二、模糊聚类分析的步骤1.选取特征指标特征要有明确的意义,要有较强的分辨力,有代表性,并确定描述特征的变量。分类事物的特征指标选择的如何,对分类结果有直接的影响。第3页,共34页,星期日,2025年,2月5日2.数据标准化(正规化)令其中,xi为原始数据;是原始数据的均值;是原始数据的标准差;是数据处理后的数据。第4页,共34页,星期日,2025年,2月5日3.标定设为待分类的对象,uj有m个刻划其特征的数据,就是根据实际情况,按一个准则或某一种方法,给论域U中的元素两两之间都赋以区间[0,1]内的一个数,叫做相似系数。它的大小表征两个元素彼此接近或相似的程度。,然后对于ui与uj,用rij表示ui与uj的当rij=0时,表示ui与uj截然不同;当rij=1时,表示ui与uj可以等同(不能说是完全相同);rij可根据具体问题来选取。方法有:的相似程度,要求第5页,共34页,星期日,2025年,2月5日(1)数量积法,其中显然.如果rij中出现负值,可采用下面方法将全体rij进行重新调整.方法1令,则方法2令其中于是第6页,共34页,星期日,2025年,2月5日(2)夹角余弦法如果rij中出现负值,也可采用上面方法调整.(3)相关系数法其中第7页,共34页,星期日,2025年,2月5日(4)最大最小法(5)算术平均最小法(6)几何平均最小法第8页,共34页,星期日,2025年,2月5日(8)指数相似系数法其中sk适当选择.(9)绝对值倒数法M适当选取使rij在[0,1]中且分散开(7)绝对值指数法第9页,共34页,星期日,2025年,2月5日(11)非参数法中正数个数,中负数个数,令则(10)绝对值减数法第10页,共34页,星期日,2025年,2月5日(12)贴近度法如果特征则ui,uj可看作模糊向量,以它们的贴近度D(ui,uj)为其相似程度.i)格贴近度,其中ii)距离贴近度其中c,a为适当选择参数值,d(ui,uj)为模糊集各种距离.iii)算术平均最小贴近度第11页,共34页,星期日,2025年,2月5日(13)主观评定法请有实际经验者直接对ui,uj的相似程度评分,作为rij的值.通过标定求出相似系数后,便可得到以rij为元素的模糊相似矩阵R(rij).4.聚类选择一种合适的聚类方法,便可得到分类结果.第12页,共34页,星期日,2025年,2月5日三、传递闭包法1.传递闭包法根据标定所得模糊矩阵R,求出其传递闭包为模糊等价矩阵,对,令λ从1降到0得到,根据进行分类:归为一类.2.最佳阈值λ的选取聚类图给出各λ值对应的分类,形成一种动态聚类,便于全面了解元素聚类,然后根据实际需要选择其阈值λ,便可确定元素的一种分类,至于如何选择阈值λ,使分类更加合理,除了凭经验外,还可用F-统计量来选取.第13页,共34页,星期日,2025年,2月5日F-统计量:为待分类事物的全体,设xjk为描述元素uj第k个特征的数据.设c为对应于λ值的类数,ni为第i类元素的个数,第i类元素记为记为第i类元素的第k个特征的平均值,而称为第i类的聚类中心向量;为全体元素的中心向量,而第14页,共34页,星期日,2025年,2月5日于是,称为F-统计量,其中为第i类中元素与中心的距离.可见,F-统计量的分子表征类与类间的距离,分母表征类内元素间的距离.因此,F值越大,说明分类越合理,与此分类相对应的F-统计量最大的阈值λ为最佳值.第15页,共34页,星期日,2025年,2月5日求传递闭包的简便方法设为模糊相似矩阵,求t(A).(1)求,假定,把A中的a1m,am1,a11,amm用圆圈圈起来,并记(2)在A中第一行、第

文档评论(0)

1亿VIP精品文档

相关文档