第4章模糊聚类分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章模糊聚类分析

主讲: 第五节 用模糊相似关系矩阵直接聚类 用传递闭包法进行模糊聚类时,常常需要把模 糊相似关系改造成模糊等价关系,然后才能聚类。 这种改造往往需要用模糊相似关系矩阵多次自乘, 计算工作量较大。那么,能否利用模糊相似关系在 不满足传递性的条件下直接进行聚类呢? 答案是肯定的。下面我们分别介绍两种利用模 糊相似关系直接聚类的方法:编网法和最大树法。 一、编网法 (5)凡能被经纬线打结连在一起的归为一类. 编网法按以下五步进行: 由于满足对称性,故只需考虑下三角部分。 按照以上五个步骤即可对模糊相似矩阵进行聚类。 例2 (环境单元分类) 每个环境单元包括空气、水分、 土壤、作物四要素,环境单元的污染状况由污染物 在四要素中含量的超限量来描述,现设有五个环境 单元,它们的污染数据如下: 1 1 3 5 2 5 3 2 4 3 4 5 5 3 5 2 1 5 2 5 x5 x4 x3 x2 x1 单元 空气 水分 土壤 作物 要素 试根据这些污染 数据对五个环境 单元进行分类。 全体归为一类. 若采用传递闭包法, 可得: 用直接聚类法: 用直接聚类法: 其系统聚类树为: 两种方法得到的结果是完全一致的. 例3 我国葡萄属植物的分类和亲缘关系探讨 晁无疾和袁志发等人对起源于我国的十一个葡 萄野生种:山葡萄、华北葡萄、燕山葡萄、婴奥葡 萄、复叶葡萄、秋葡萄、毛葡萄、网脉葡萄、兰葡 萄、刺葡萄和华东葡萄进行了分类研究。指标选为 各个种过氧化物酶同工酶,包括各个种的酶带表现 和不同酶带的表现频率(用电泳法测定)。 (1) 测定数据(略) (2) 标定(仍采用刘来福标准遗传距离) 各个葡萄种间标准遗传距离和相似系数为: 各个葡萄种间标准遗传距离和相似系数(续) (3) 编网 (4) 绘制系统聚类图 根据实际的调查和对种(群)的研究深度,以及多次 电泳测定结果,和目前国内对野生葡萄属植物的调查研究 资料,并参考多年的电泳分析结果,在葡萄属植物的聚类 分析中, ?的取值以0.995为宜。 再根据进化系统分析,毛葡萄是我国葡萄属植物中较 原始的类型,其它种类的分化则较晚。这个推断和我国葡 萄属植物的地理分布及种的扩散范围也是一致的。详细内 容可参阅晁无疾等所写《我国葡萄属植物分类和亲缘关系 的探讨》一文。 4. 模糊等价关系(fuzzy equivalency relations) 定义4 若R是模糊自反、对称、传递关系,则称R是一个 模糊等价关系。 例如 R是对称阵且主对角线元素全为1,故为模糊对称及 自反关系。 二、 ? -截关系法聚类 由第一节知,一个普通(分类)等价关系可以唯一 确定一个分类,而模糊等价关系的任一? -截关系都是 一个普通等价关系。因此,可以利用这一性质,把 ? 从1逐渐降到0,就可得到一系列的普通(分类)等价 关系,这样就能将原模糊分类变成一系列普通分类问 题,并且这一系列的普通分类一个是一个的子类,由 此就可画出相应的系统聚类图,从而达到进行模糊分 类的目的。 其系统聚类图如下: 第四节 模糊相似关系与传递闭包 一、模糊相似关系 定义1 则称R为模糊相似关系. 模糊相似关系与模糊等价关系的区别就在于, 模糊相似关系不要求具有传递性,而模糊等价关系 必须满足传递性。 即 R 满足自反性和对称性, 定理1 证明: 由于在聚类分析的第二步中,得到的模糊关系矩阵 R 未必是模糊等价关系,这样的 R 往往并不能满足传 递性。因此,这个R不能直接利用? -截关系法进行聚 类,需要将R改造为等价模糊关系,从而再利用λ-截 关系法进行聚类。 改造R的关键是,要使得R具有传递性。传递闭包 法就是改造R使其具有传递性的一种方法。 二、模糊传递闭包(transitive closure) 定义2 即能被任一R的传递关系所包含的传递关系叫做传递 闭包。换句话说,包含模糊关系R的最小的传递模糊 关系叫R的传递闭包。 注: (1) 传递闭包若存在,则唯一; 定理2 证明: 定理3 证明: 第一步: 由于 依此类推, 则有: 第二步:证明 第三步:证明 依次类推, 推论1 证明: 例1 推论2 证明: 另外, 推论3 证明: 如何来求相似关系 R 的传递闭包?由定理3可知,当 分类对象有限时,可通过如下方法求得,若 上述通过逐步合成来求传递闭包的方法是可以加速 的,其加速算法如下: 显然这样的 l 总是存在的,并且 l 不会超过 n . 则: 这种平方法最多只需要[log2 n ]+1步即可得到传递闭包. 例2 设 求 R* . 例3 设

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档