基于MATLAB的模糊ISODATA算法设计.doc

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档 知识共享 基于MATLAB的模糊ISODATA算法设计 目 录 TOC \o "1-3" \h \z \u 一、前言 1 二、模糊ISODATA算法的基本原理 1 三、模糊ISODATA算法的基本步骤 3 四、模糊ISODATA算法MATLAB程序实现 7 (一)模糊ISODATA算法MATLAB程序流程图 7 (二)模糊ISODATA算法程序运行结果及分析 7 1、初始化数据 8 2、修改初始化数据e,其他同1 14 3、修改初始化数据m,其他同1 16 五、后22组样本的聚类结果 19 六、结论 20 参考文献 21 程序 23 精品文档 知识共享 一、前言 G. H. Ball与D. J. Hall于1965年提出的ISODATA算法是一个通过逐步修改聚类中心的个数与位置来达到分类目的的集群算法,后来不断有人提出它的各种改进算法,其中包括Ball和Hall 1967年提出的改进算法、CLASS、Asp等。1974年J. C. Dunn首次提出应用模糊数学判据的ISODATA集群算法——Fuzzy ISODATA(Iterative Self-Organizing Data Analysis Technique)。算法通过每样本点对各类的隶属度矩阵表示分类结果。通过不断修改聚类中心的位置来进行分类。1976年J. C. Bezdek把Dunn的方法推广到更一般的情形,并得到了一些有益的结论,其中包括新的判据,隶属度函数与聚类中心的计算公式。Bezdek于1979年用W. Zangwill的理论证明了Fuzzy ISODATA的收敛性。该方法已在行星跟踪系统,心脏病分析和天气预报等方面得到了应用。[1] 二、模糊ISODATA算法的基本原理 J. C. Bezdek 在普通分类基础上, 利用模糊集合的概念提出了模糊分类问题。认为被分类对象集合X 中的样本 以一定的隶属度属于某一类,即所有的样本都分别以不同的隶属度属于某一类。[2]因此,每一类就被认为是样本集X 上的一个模糊子集,于是,每一种这样的分类结果所对应的分类矩阵,就是一个模糊矩阵。模糊ISODATA 聚类方法从选择的初始聚类中心出发,根据目标函数,用数学迭代计算的方法反复修改模糊矩阵和聚类中心,并对类别进行合并、分解和删除等操作,直到合理为止。[3] 设有限样本集(论域) ,每一个样本有s 个特征 。即样本的特征的矩阵: 欲把它分为K类(),则N个样本划分为K类的模糊分类矩阵为: 其满足下列三个条件: Ⅰ、 Ⅱ、 Ⅲ、 条件Ⅱ表明每一样本属于各类的隶属度之和为1;条件Ⅲ表明每一类模糊集不可能是空集合,即总有样本不同程度的隶属于某类。[4] 定义K个聚类中心。其中:。 第i类的中心即人为假想的理想样本,它对应的s个指标值是该类样本所对应的指标值的平均值: 构造准则函数: 其中,表示第j个样本与第i类中心之间的欧式距离;J表示所有待聚类样本与所属类的聚类中心之间距离的平方和。[5] 为了确定最佳分类结果,就是寻求最佳划分矩阵U和对应的聚类中心Z,使J达到极小。Dunn证明了求上述泛函的极小值的问题可解。[6] 三、模糊ISODATA算法的基本步骤 (1)选择初始聚类中心。例如,可以将全体样本的均值作为第一个聚类中心,然后在每个特征方向上加和减一个均方差,共得个聚类中心,n是样本的维数(特征数)。也可以用其他方法选择初始聚类中心。 (2)若已选择了K个初始聚类中心,接着利用模糊K-均值算法对样本进行聚类。由于现在得到的不是初始隶属度矩阵,而是各类聚类中心,所以算法应从模糊K-均值算法的第四步开始,即直接计算下一步的隶属度矩阵。[7]继续K-均值算法直到收敛为止,最终得到隶属度矩阵U和K个聚类中心。然后进行类别调整。 ①计算初始隶属度矩阵,矩阵元素的计算方法为 式中,是第j个样本到第i类初始聚类中心的距离。为避免分母为零,特规定:若,则, ;可见,越大,越小。 ②求各类的新的聚类中心,L为迭代次数。 式中,参数,是一个控制聚类结果模糊程度的常数。可以看出各聚类中心的计算必须用到全部的N个样本,这是与非模糊的K-均值算法的区别之一。在K-均值算法中,某一类的聚类中心仅由该类样本决定,不涉及其他类。[8] ③计算新的隶属度矩阵,矩阵元素的计算方法为 式中,是第L次迭代完成时,第j个样本到第i类聚类中心的距离。为避免分母为零,特规定:若,则, ;可见,越大,越小。 ④回到第③步,重复至收敛。收敛条件为 ,其中,为规定的参数。[9] (3)类别调整。调整分三种情形: ①合并。 假定各聚类中心之间的平均距离为D,则取合并阈值为 其中,是人为构造的函数,,而且应

您可能关注的文档

文档评论(0)

哆啦 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档