模式识别作业.docVIP

下载本文档

17
0
约1.49万字
约 23页
2017-10-10 发布于湖北
举报
版权申诉

模式识别作业.doc

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模式识别作业

模式识别作业模糊C-均值聚类分析的应用学院、系电子信息工程学院自动化系专业名称模式识别与智能系统年级 2009 级学生姓名郭佳学号目录 1．前言 1 2．模糊C均值算法 2 2.1 FCM算法准则 2 2.2 模糊C均值算法步骤 3 2.2.1简介 3 2.2.2 FCM算法具体步骤 4 3．模糊C均值聚类算法的Matlab实现 5 3.1 实验数据 5 3.2 模糊C均值聚类程序分析 7 3.3 Matlab实现及结果分析 7 3.3.1前29组数据的聚类分析 7 3.3.2 49组数据的聚类分析 15 总结 20 参考文献 21 模糊C-均值聚类分析的应用 1．前言聚类就是按照一定的要求和规律对事物进行区分和分类的过程，在这一过程中没有任何关于类分的先验知识，仅靠事物间的相似性作为类属划分的准则，因此属于无监督分类的范畴。聚类分析则是指用数学的方法研究和处理给定对象的分类。“人以群分，物以类聚”，聚类是一个古老的问题，它伴随着人类社会的产生和发展而不断深化，人类要认识世界就必须区别不同的事物并认识事物间的相似性。传统的聚类分析是一种硬划分，它把每个待辨识的对象严格地划分到某个类中，同一事物属于且仅属于所划定类别中的某一类，具有非此即彼的性质。例如在描述人的很多特征之一——性别的时候，很容易就可以对人进行分类，因为性别只有男性和女性之分，因此这种分类的类别界限是分明的、清晰的、不含糊的，属于普通集合理论的范畴。而实际上大多数对象并没有严格的属性，它们在形态和类属方面存在着中介性，适合进行软划分，用普通集合的理论往往不能完全解决具有模糊性的分类问题。例如：将人按身高分为：高个子、中等个子、矮个子；图1-1所示经典硬聚类无法解决的聚类问题示意图，I部分代表高个子，II部分代表矮个子，但是他们的交集部分，用传统的硬聚类分析方法就无法解决。图1-1经典硬聚类无法解决的聚类问题示意图在此基础上，Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具，人们开始用模糊的方法来处理聚类问题，并称之为模糊聚类分析。应该指出，基于模糊集理论的模糊逻辑本身并不是模糊的，而是用来对“模糊”进行处理以达到消除模糊的逻辑。事实上，模糊逻辑是一种精确地解决不精确、不完全信息的方法，其最大的特点就是用它可以比较自然的处理人类的概念。具体地说，模糊逻辑是通过模糊集合来工作的，模糊集合与传统集合的本质区别在于：(1)传统集合对集合中的元素关系进行严格区分，一个元素要么属于此集合，要么不属于此集合，并且不存在介于二者之间的情况；(2)模糊集合则具有灵活的隶属关系，允许元素在一个集合中部分隶属。元素在模糊集合中的隶属度可以是从0到1之间的任何值，而不像在传统集合中要么是0要么是1，这样模糊集合可以从“不隶属”到“隶属”逐级的过渡。正是由于模糊聚类具有样本属于各个类别的不确定性程度，表达了样本类属的中介性，即建立起了样本对于类别的不确定性的描述，能更客观地反映现实世界，从而成为聚类分析研究的主流。为了优化聚类分析的目标函数，人们提出了现在相当流行和应用广泛的模糊C-均值FCM(Fuzzy C-means)聚类算法。该算法是从硬C-均值HCM(Hard C-means)聚类算法发展而来的。 2．模糊C均值算法 2.1 FCM算法准则给定数据集，其中每个元素包含s个属性。模糊聚类就是要将X划分为c个类，为C个类的聚类中心在模糊划分中，每一个样本点不能严格地被划分到某一类，而是以一定的隶属度属于某一类。令表示第j个样本点第i个类的隶属度。且满足下式: （2.1） (2.2) (2.3) FCM算法的目标函数为: (2.4) 其中，为样本点与聚类中心之间的距离则FCM算法就是要求满足的情况下目标函数J的最小值，J的条件极值可以由拉格朗日乘数法求得。首先，J在(2.4)式下的条件极值可以表示成(2.5) 式,其中函数为常数: （2.5）对求偏导经过计算后得：，用同样的方法为最小值时的值为： (i=1,2…c) 2.2 模糊C均值算法步骤 2.2.1简介 FCM算法有五个参数(，A，c，m，ε)，改变任何一个参数都将影响到FCM聚类的最终结果。 (1)为初始隶属度矩阵，它直接影响到聚类中心的初始值，隶属度可以看做是数据对聚类中心作用力强度的表征，隶属度越大，数据对类中心的吸引力就越大，类中心的下一次迭代值受它的影响也就越大，从而影响到算法的迭代次数，也就影响了算法的计