5-2特征提取K-L变换概览.pptVIP

下载本文档

12
0
约 47页
2016-10-25 发布于湖北
举报
版权申诉

5-2特征提取K-L变换概览.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

类别可分离性判据为什么需要类别可分离性判据特征选择与特征提取的任务是求出一组对分类最有效的特征所谓有效是指在特征维数减少到同等水平时，其分类性能最佳因此需要有定量分析比较的方法, 判断所得到的特征维数及所使用特征是否对分类最有利这种用以定量检验分类性能的准则称为类别可分离性判据为什么需要类别可分离性判据一般说来分类器最基本的性能评估是其分类的错误率如果能用反映错误率大小的准则，在理论上是最合适的对错误率的计算是极其复杂的，以至于很难构筑直接基于错误率的判据为此人们设法从另一些更直观的方法出发，设计出一些准则，用来检验不同的特征组合对分类性能好坏的影响，甚至用来导出特征选择与特征提取的方法这些准则就是类别可分离性判据 8.3.3 特征提取方法小结特征提取方法从其工作原理来看可以分成两大类对样本在特征空间分布的距离度量其基本思想是通过原有特征向量线性组合而成新的特征向量做到既降维，又能尽可能体现类间分离，类内聚集的原则对样本在特征空间分布的距离度量在欧氏距离度量的条件下所提出的几种判据都是从这一点出发的从概率分布的差异出发，制订出反映概率分布差异的判据，以此确定特征如何提取这类判据由于与错误率之间可能存在单调或上界关系等，因此从错误率角度考虑有一定的合理性但是使用这种方法需要有概率分布的知识，并且只是在概率分布具有简单形式时，计算才比较简便从概率分布的差异出发，制订出反映概率分布差异的判据，以此确定特征如何提取熵概念的运用是描述概率分布另一种有用的形式利用熵原理构造的判据，进行特征提取各个方法中都有一个共同的特点即判别函数的极值往往演变为找有关距阵的特征值与特征向量，由相应的特征向量组成坐标系统的基向量计算有关矩阵的特征值矩阵与特征向量，选择前d个大特征值，以它们相应的特征向量构成坐标系统这是大部分特征提取方法的基本做法。特征选择方法不相同 5.4 基于K-L变换的多类模式特征提取对一类模式：维数压缩。对多类模式：维数压缩，突出类别的可分性。特征提取的目的：卡洛南-洛伊（Karhunen-Loeve）变换（K-L变换）： * 一种常用的特征提取方法； * 最小均方误差意义下的最优正交变换； * 适用于任意的概率密度函数； * 在消除模式特征之间的相关性、突出差异性方面有最优的效果。离散K-L变换连续K-L变换分为： 1．K-L展开式 aj：随机系数；用有限项估计X时：引起的均方误差：代入X、，利用由两边左乘得。 uj为确定性向量 R：自相关矩阵。：拉格朗日乘数说明：当用X的自相关矩阵R的特征值对应的特征向量展开X 时，截断误差最小。选前d项估计X时引起的均方误差为因此，当用X的正交展开式中前d项估计X时，展开式中的uj应当是前d个较大的特征值对应的特征向量。 K-L变换方法：对R的特征值由大到小进行排队：均方误差最小的X的近似式：矩阵形式：式中，，。其中：（5-49） —— K-L展开式对式(5-49)两边左乘U t ： —— K-L变换系数向量a就是变换后的模式向量。 2．利用自相关矩阵的K-L变换进行特征提取第一步：求样本集{X}的总体自相关矩阵R。决定压缩后的维数 3．不同散布矩阵的K-L变换根据不同的散布矩阵进行K-L变换，对保留分类鉴别信息的效果不同。多类类内散布矩阵：若要突出各类模式的主要特征分量：选用对应于大特征值的特征向量组成变换矩阵；若要使同一类模式聚集于最小的特征空间范围：选用对应于小特征值的特征向量组成变换矩阵。类间散布矩阵：适用于类间距离比类内距离大得多的多类问题，选择与大特征值对应的特征向量组成变换矩阵。总体散布矩阵：把多类模式合并起来看成一个总体分布。适合于多类模式在总体分布上具有良好的可分性的情况。采用大特征值对应的特征向量组成变换矩阵，能够保留模式原有分布的主要结构。 1）变换在均方误差最小的意义下使新样本集{X *}逼近原样本集 {X}的分布，既压缩了维数又保留了类别鉴别信息。利用K-L变换进行特征提取的优点： 2）变换后的新模式向量各分量相对总体均值的方差等于原样本集总