模式识别作业.docVIP

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别作业

模式识别作业 模糊C-均值聚类分析的应用 学院、系 电子信息工程学院自动化系 专业名称 模式识别与智能系统 年 级 2009 级 学生姓名 郭佳 学 号 目录 1. 前言 1 2.模糊C均值算法 2 2.1 FCM算法准则 2 2.2 模糊C均值算法步骤 3 2.2.1简介 3 2.2.2 FCM算法具体步骤 4 3. 模糊C均值聚类算法的Matlab实现 5 3.1 实验数据 5 3.2 模糊C均值聚类程序分析 7 3.3 Matlab实现及结果分析 7 3.3.1前29组数据的聚类分析 7 3.3.2 49组数据的聚类分析 15 总结 20 参考文献 21 模糊C-均值聚类分析的应用 1. 前言 聚类就是按照一定的要求和规律对事物进行区分和分类的过程,在这一过程中没有任何关于类分的先验知识,仅靠事物间的相似性作为类属划分的准则,因此属于无监督分类的范畴。聚类分析则是指用数学的方法研究和处理给定对象的分类。“人以群分,物以类聚”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性。 传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,同一事物属于且仅属于所划定类别中的某一类,具有非此即彼的性质。例如在描述人的很多特征之一——性别的时候,很容易就可以对人进行分类,因为性别只有男性和女性之分,因此这种分类的类别界限是分明的、清晰的、不含糊的,属于普通集合理论的范畴。而实际上大多数对象并没有严格的属性,它们在形态和类属方面存在着中介性,适合进行软划分,用普通集合的理论往往不能完全解决具有模糊性的分类问题。例如:将人按身高分为:高个子、中等个子、矮个子;图1-1所示经典硬聚类无法解决的聚类问题示意图,I部分代表高个子,II部分代表矮个子,但是他们的交集部分,用传统的硬聚类分析方法就无法解决。 图1-1经典硬聚类无法解决的聚类问题示意图 在此基础上,Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析。应该指出,基于模糊集理论的模糊逻辑本身并不是模糊的,而是用来对“模糊”进行处理以达到消除模糊的逻辑。事实上,模糊逻辑是一种精确地解决不精确、不完全信息的方法,其最大的特点就是用它可以比较自然的处理人类的概念。具体地说,模糊逻辑是通过模糊集合来工作的,模糊集合与传统集合的本质区别在于:(1)传统集合对集合中的元素关系进行严格区分,一个元素要么属于此集合,要么不属于此集合,并且不存在介于二者之间的情况;(2)模糊集合则具有灵活的隶属关系,允许元素在一个集合中部分隶属。元素在模糊集合中的隶属度可以是从0到1之间的任何值,而不像在传统集合中要么是0要么是1,这样模糊集合可以从“不隶属”到“隶属”逐级的过渡。正是由于模糊聚类具有样本属于各个类别的不确定性程度,表达了样本类属的中介性,即建立起了样本对于类别的不确定性的描述,能更客观地反映现实世界,从而成为聚类分析研究的主流。 为了优化聚类分析的目标函数,人们提出了现在相当流行和应用广泛的模糊C-均值FCM(Fuzzy C-means)聚类算法。该算法是从硬C-均值HCM(Hard C-means)聚类算法发展而来的。 2.模糊C均值算法 2.1 FCM算法准则 给定数据集,其中每个元素包含s个属性。模糊聚类就是要将X划分为c个类,为C个类的聚类中心在模糊划分中,每一个样本点不能严格地被划分到某一类,而是以一定的隶属度属于某一类。令表示第j个样本点第i个类的隶属度。且满足下式: (2.1) (2.2) (2.3) FCM算法的目标函数为: (2.4) 其中,为样本点与聚类中心之间的距离 则FCM算法就是要求满足的情况下目标函数J的最小值,J的条件 极值可以由拉格朗日乘数法求得。首先,J在(2.4)式下的条件极值可以表示成(2.5) 式,其中函数为常数: (2.5) 对求偏导经过计算后得:,用同样的方法为最小值时的值为: (i=1,2…c) 2.2 模糊C均值算法步骤 2.2.1简介 FCM算法有五个参数(,A,c,m,ε),改变任何一个参数都将影响到FCM聚类的最终结果。 (1)为初始隶属度矩阵,它直接影响到聚类中心的初始值,隶属度可以看做是数据对聚类中心作用力强度的表征,隶属度越大,数据对类中心的吸引力就越大,类中心的下一次迭代值受它的影响也就越大,从而影响到算法的迭代次数,也就影响了算法的计

文档评论(0)

allap + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档