模糊聚类与模式识别探索.ppt

下载文档 降价啦

6
0
约7.17千字
约 72页
2016-08-11 发布于湖北
举报
版权申诉
保障服务

模糊聚类与模式识别探索.ppt

1、本文档共72页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

聚类分析的基本概念 “聚类”就是按照一定的要求和规律对事物进行区分和分类的过程, 在这一过程中没有任何关于分类的先验知识, 仅靠事物间的相似性作为类属划分的准则, 属于无监督分类的范畴。 “聚类分析”是指用数学的方法研究和处理给定对象的分类。 “人以群分, 物以类聚”, 聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化, 人类要认识世界就必须区别不同的事物并认识事物间的相似性。聚类分析的基本概念聚类分析是多元统计分析的一种, 它把一个没有类别标记的样本集按某种准则划分成若干个子集(类), 使相似的样本尽可能归为一类, 而不相似的样本尽量划分到不同的类中。传统的聚类分析是一种硬划分, 它把每个待辨识的对象严格地划分到某类中, 具有非此即彼的性质, 因此这种类别划分的界限是分明的。而实际上大多数对象并没有严格的属性, 它们在性态和类属方面存在着中介性, 具有亦此亦彼的性质,因此适合进行软划分。聚类分析的基本概念模糊集理论的提出为软划分提供了有力的分析工具, 用模糊数学的方法来处理聚类问题, 被称之为模糊聚类分析。由于模糊聚类得到了样本属于各个类别的不确定性程度, 表达了样本类属的中介性, 更能客观地反映现实世界, 从而成为聚类分析研究的主流。模糊聚类已经在诸多领域获得了广泛的应用, 如模式识别、图像处理、信道均衡、矢量量化编码、神经网络的训练、参数估计、医学诊断、天气预报、食品分类、水质分析等。聚类分析的基本概念常用的模糊聚类分析方法大致可分为两大类：其一是基于模糊关系(矩阵)的聚类分析方法, 而作为其中核心步骤的模糊分类,有下述的主要方法：模糊传递闭包法、直接聚类法、最大树法和编网法; 其二是基于目标函数的聚类分析方法, 称为模糊C均值(FCM)聚类算法(或称为模糊ISODATA聚类分析法) (Iterative Self-Organizing Data Analysis Techniques Algorithm 迭代自组织数据分析) 。相似系数法 ----(3)相关系数法例细胞染色体形状的模糊识别蠓的分类 DNA序列分类与模糊识别取，得取，得取，得取，得画出动态聚类图如下： 0.7 0.63 0.62 0.53 1 对于不同的λ∈[0,1]，可得不同的分类方案，从而形成一种动态聚类图。这对全面了解对象的分类情况是比较形象和直观的。但有的实际问题需要选择某个阀值λ，确定一个具体的分类，这就是确定阀值λ的问题。二、最佳阀值λ的确定在动态聚类过程中，调整λ的值以得到适当的分类。另外，也可由熟悉专业的专家确定阀值λ，得到阀值λ水平上的分类。 1.按实际需要确定设对应于λ的分类数为r，第j类的样品数为nj , j类的样本记为: 2.用F-统计量确定λ的最佳值第j类的聚类中心为向量: 第j类中第k个变量的平均值: 定义F-统计量为: 表征了类与类之间的距离表征类内样品间的距离 F越大,表明类间的差异越大,分类效果就越好。为: 与的距离。为第j类中样品与的距离。假设各类差异不明显，对于给定的检验水平α，查Fα(r-1, n-r)分布表，得临界值Fα，若FFα,则认为各类之间有明显的差异。 F服从自由度为r-1，n-r的F分布。简单讲,模型识别就是根据研究对象具有的某些特征对其进行识别并归类。如采集的植物标本识别它属于哪个纲目;又如拨打电话号码识别对应的电话机。这种模型识别具有2个本质的特征: §2 模糊模型识别一、基本概念 ①事先已知若干标准模型(称为标准模型库), 模型具有明显的界线; 1. 模型识别 ②有待识别归类的对象，并且它所属的类必然是若干标准模型之一。模糊模型识别是指标准模型库中的模型是模糊的(模型间没有明显的界线)。如据电测或气测资料,建立的储层含油气性(油层、油气层、油水同层、气层、含水油层、干层等)标准模型库,又如由不同沉积相岩样观测值构成的岩样标准模型库,它们中的模型都是模糊的。因此,根据测井信息或者岩样的观测值判断钻穿储层的含油气性、岩样的沉积相是一个模糊集对标准模糊集的识别问题。对于这类模型识别问题，可据模型的界线对待识别对象进行归类，是标准集对标准集的识别。 2. 模糊模型识别为了解决模糊集的识别问题，需要一个度量模糊集与标准模糊集靠近程度的指标，这就是下面要介绍的隶属度和贴近度。 (1)模糊向量及其内外积若0≤ai≤1(i=1,2,…,n),则称向量a=(a1,a2,…,an)为模糊向