- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 第7章 模糊聚类分析 一、模糊聚类分析及其步骤 二、基于模糊等价关系的传递闭包法 三、基于模糊相似关系的直接聚类法 四、基于模糊c-划分的模糊聚类法 模糊聚类分析是一类应用很广泛的数学方法,就其理论来说,大致分为三种:一是基于模糊等价关系的传递闭包法,二是基于模糊相似关系的直接聚类法,三是基于模糊c-划分的模糊聚类法。 §7.1 模糊聚类分析及步骤 数学上,把按一定要求和规律,对事物进行分类的方法叫聚类分析,它属于数理统计多元分析的一支,是对清晰事物进行分类的一种方法,然而现实生活中,事物间的界限往往不一定很清晰,很多分类问题,都多伴有模糊性,如天气,晴、阴、雨天之间就无绝对的界限,普通的聚类分析对此是无能为力的;用模糊数学的语言和方法来描述和解决就成为自然和方便的了,这就产生了模糊聚类分析 模糊聚类分析的步骤: 一、选择统计指标 根据实际问题,选择那些具有明确的意义,有较 强的分辨力和代表性的特征,作为分类事物的统计指 标,统计指标选择的如何,对分类结果有直接的影响; 二、数据标准化(正规化) 把代表事物各特征的统计指标的数据进行处理,使 之便于分析和比较,数据标准化可这样进行:令 其中x原始数据, 为其的平均值,?为其标准差 三、标定 所谓标定,就是根据实际情况,按一个准 或某种方法,给论域 U中的元素两两之间 都赋以[0,1]间的一个数,叫做相似系数,其大小表征 两个元素彼此接近或相似的程度; 设 为待分事物的全体, 由一组数 据 来表征,用 表示元素 的相似 系数, 表示 截然不同,毫无相似 之处; 表示 完全相似或等同;当i=j时, 就是 和自己的相似程度,恒取1 可据实际情况,选择下列方法之一来确定: (1)数量乘积法 其中 显然 如果 中出现负值,可采用下面 方法将全体 进行调整. 方法1. 令 则 方法2. 令 于是 其中 (2)夹角余弦法 如果 中出现负值,也可采用上面方法调整. (3)最大最小法 (4)算术平均最小法 (5)绝对值减数法 其中c适当选取,使 在[0 ,1]中且分散开. 后, 其它方法请参阅教材!以上方法 究竟选哪一种,视问题实际特点而定, 通过标定求出相似系数 可得模糊相似矩阵 四、聚类 选择一种合适的聚类方法,便可以得到分类结果. §7.2 基于模糊等价关系的传递闭包法 一、传递闭包法 Basic idea : 据上面标定所得的模糊矩阵R, 求出其传递闭包 为模糊等价矩阵, 然后由§3.4之方法,令?从1降到0,便可按需要 对U进行分类,这样的聚类方法,称传递闭包法 例7.1 环境单元分类 设 为五个环境单元的集合,每个 环境单元有空气、水分、土壤、作物四个要素,环境 单元的污染状况由污染物在四个要素中含量的超限度 来描述,若其污染数据为: 试对U进 行分类. 解: (1)按绝对值减数法进行标定,如取c=0.1,则 于是得模糊相似矩阵 (2)用逐次平方法计算R的传递闭包 因为 所以传递闭包 然后依次取?的截矩阵 并按 将U分成等价类. 若?=1, 便将U分为5类, 即 若?=0.8, 便将U分为4类, 即 若?=0.6, 便将U分为3类, 即 若?=0.5, 便将U分为2类, 即 若?=0.4, 便将U全归为为1类, 即 聚类图见教材§3.4图3-3 ? 二、最佳或值?的确定 聚类图给出各?值对应的分类,形成一种动态聚类,便于全面了解元素聚类, 然后根据实际需要选择其或值?便可确定一种分类, 至于如何选择或值?, 使分类更合理, 除了凭经验外, 还可用F-统计量来选取. 设 为待分事物的全体, 为描述元素 的第k个特征的数据, 又设c为对应于?值的类数, 为第i类元素的个数, 第i类元素记为 记 为第i类元素第k个特征的平均值, 称 为第i 类的聚类中心向量; 为全体元素 的中心向量, 而 于是称 为F-统计量, 其中 为第i类中心 元素 的距离. 例7.2 气象预报中最佳或值的选取(数据分析见教材 第156页) §7.3 基于模糊相似关系的直接聚类法 Basic idea : 用传递闭包法分类需要先建立U上 的模糊等价矩阵, 但矩阵阶数较高时, 计算便变得较 困难.而采用相似矩阵R进行分类的直接聚类法其计算 量则要小很多,这种方法聚类的原则是: 与 在?水平上同类?在R的图中, 存在一条权重 不低于?的路联结 与 直接聚类法 最大树法 编网法 ①画出以被分类元素为结点,以相似矩阵R的元 素 为权重的一棵最大树; ②取定??[0,1],砍断权重低于?的枝,得到一个不连通图,各连通分支便构成了在?水平上的分类 对给定的模糊相似矩阵R,取定水平??[0,1],作截矩阵R?,在R?主对角线上填入元素的符号
文档评论(0)