6patternrecognitionc5.pptVIP

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6patternrecognitionc5

第五章 模式特征分析与选取 ;第五章 模式特征分析与选取 ;模式识别建立在对模式特征量化的基础上。首先要对表征模式的各种特征加以量测或量化,得到每一模式的特征数值集合,或特征向量,然后根据不同类型模式具有不同的特征数值集合,进行自动辨别。 问题一:特征数值向量的分量个数很多(或维数很多),但是否都能有效地代表各类模式,针对不同的对象,是否都需要那么多特征来进行辨别。 结论:模式维数很高的情况下,计算量太大,且识别精度并不一定随着维数增多而提高。如陆地卫星1号有十二个波段的数据,而从识别精度来分析,三、四个波段的组合却是最好的,下图说明了有关方面的实验结果。这里有个特征挑选和优化的问题,或最佳组合的问题,也就是说需要选择最有代表性的特征。针对不同的研究对象,还需要进行不同的特征组合。;特征数值与识别精度的关系;问题二:有时特征量测值较少,模式集合处于低维空间,给自动分类带来困难。比如热红外航片数字化以后只有一维,这时需要考虑引入辅助数据,或其它影像数据以增加维数。 结论:为了提高识别精度而采取增加模式维数的方法。 综上所述,模式特征要进行特征优化、特征选取,而特征优化的前提是特征分析。本章所介绍的就是特征分析的理论。 ;第一节 描述模式分布状态的测度;一,欧氏距离 ;2,类内距离: 同一类模式内所有点之间距离平方的平均值。 若同类点集为:;3,类间距离: 两类模式集合 ,各有 和 个样本,则类间距离为 ;二,离散度 ; 2,离散度; 离散度表示两类样本可区分程度的量度。; ; 可见?i是样本y各本征分量的方差,即 ;四,熵 设某类样本x出现的概率为P(x),则用来度量类内异样性的总体熵为 ;当 为正态分布时,有:;对于一维模式来说, 是样本方差,这个方差值越小,则H值越小,它表示凝聚程度越高。对于多维模式来说,若所有样本X经过线性变换,则 为C的各本征值的乘积,即 ;在特征维数较多的情况下,选取其中有利于分类的特征,以减少特征维数,减少内存负担,加快运算速度,提高效率,是自动分类中的一个重要问题。 如何降低维数,保证有较好分类精度呢?一般要依据一些准则,这些准则是利用前节所述测度理论进行的。;一, 独立特征的选取准则 若原始的各特征量测值是统计独立的,即其相关性很小,则可利用训练样本集逐一对各特征分量进行分析,看其对于各类样本可分性的程度大小如何。 对于 和 两类n维样本,其第K维的样本均值为mik和mjk,方差为 和 。 准则函数:;二,一般情况下的特征选取准则 考虑到各特征分量之间常常存在相关性,可采用如下准则: ;(3),总体散布矩阵; 2,散度准则 当类概率密度分布为正态分布时,散度准则:;上式是对两两类别的 值相加而得的。这种根据平均散度选择特征的方法虽然合理,但容易掩盖某些散度较小的类对。因为只要其中某些类对散度很大,计算平均散度时就有显著数值。为此,将上述散度公式加以改化,定义变换散度;当 相当大时, 只不过平稳趋于100%处,此处被称为“饱和态”。而对较小散度的变化, 则较为敏感。下图指出了对于变化的敏感度,说明了它们之间的单调变化规律。; 3,Bhattacharyya距离和Jeffries-Matusita距离准则 (即J-M距离准则);显然,与散度准则一样,存在数值大的 项掩盖数值较小项的问题。故也采取改化方法,得到J-M距离公式:;三,穷举法 ;此方法是从C类中选出最难分离的一对类别,即选用对应于C类中类对距离最小的准则函数数值,来代替变换散度或J-M准则。此时,首先用散度或B氏距离计算出C类中每一类别对之间的距离 ,再从所有 中选出最小值,即; 对应于d的特征子集,就是最佳的特征组合选择。此方法可以避免变换散度和J-M准则中的许多对数计算。;一般说来,对于每类模式,由于 不同,各类较小的 也不相同,实际计算时,认为各类协方差矩阵相同,即 以此作为近似条件来确定较小的 ,以由它们对应的本征向量组成变换矩阵A,对原来的模式向量x施以线性变换:;5,OIF(Optimum Index Factor)指标 OIF指标是ARIES一III图像处理系统中采取的一种简单易行的模式可分性测度和特征选取方法。其定义为:;例:西藏班戈县西扎乡陆地卫星MSS四个波段的影像窗(850像元×1100像元)按32象元间隔采样,共计29325个象元,计算每三个波段的OIF

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档