模式识别-5--特征选择与提取精品.ppt

下载文档 降价啦

73
0
约9.95千字
约 65页
2018-04-24 发布于湖北
举报
版权申诉
保障服务

模式识别-5--特征选择与提取精品.ppt

1、本文档共65页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

模式识别-5--特征选择与提取精品

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 作业 1. 设有如下三类模式样本集ω1，ω2和ω3，其先验概率相等，求Sw和Sb ω1：{(1 0)t, (2 0) t, (1 1) t} ω2：{(-1 0)t, (0 1) t, (-1 1) t} ω3：{(-1 -1)t, (0 -1) t, (0 -2) t} 作业 2. 设有如下两类样本集，其出现的概率相等： ω1：{(0 0 0)T, (1 0 0) T, (1 0 -1) T , (1 1 0) T} ω2：{(0 0 -1)T, (0 1 0) T, (0 1 -1) T , (1 1 -1) T} 用K-L变换，分别把特征空间维数降到二维和一维，并画出样本在该空间中的位置。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 5.2 特征选择解决方法：引入变换散度和之间的变化关系：（1）随着的增加而增加，先快后慢。（2）的取值范围有限度（饱和度）。作用：中和、抵消、保留。平均变换散度：和之间的变化关系？？？ 5.2 特征选择（C）巴氏距离和詹夫利斯－马特西斯距离（J-M距离）对正态分布模式的巴特查斯距离，如果Ci =Cj时候，能得到非常简单的形式对aij取平均值但是会存在数值大aij的掩盖数值小aij的情况， 5.2 特征选择因此我们可以引用前面的变换方法，作一个类似的简单的变换来消除这种情况再取平均值 5.2 特征选择 5.2.4穷举式特征选取方法3中介绍的一般原则，只是给出了比较科学的准则函数，但是还没有给出比较好的算法解决从n中测量值中选出m个作为分类特征量。这时采用1中介绍的思路，即按照中特征组合方案来进行穷举，得到选择最优。但是穷举法有个不利因素就是，计算量大，一则来之与当n很大的时候，计算量大，二则来自于本身可能要作矩阵运算或者求幂次运算。这可以从下面两种方法来降低运算量或者进一步简单化。 5.2 特征选择 5.2.4 穷举式特征选取 a）最大最小类对距离法对多类问题，不是直接采用散度或者J-M准则来计算，而是计算类对距离来选择特征，或者采用更简单的方式（b）分支定界搜索法核心思想是：逐一降维要求：准则函数按照特征维数单调变化性质方法：在分支树中找到J最大的节点。 5.3 离散K-L变换全称：Karhunen-Loeve变换（卡洛南-洛伊变换）前面讨论的特征选择是在一定准则下，从n个特征中选出k个来反映原有模式。这种简单删掉某n-k个特征的做法并不十分理想，因为一般来说，原来的n个数据各自在不同程度上反映了识别对象的某些特征，简单地删去某些特征可能会丢失较多的有用信息。如果将原来的特征做正交变换，获得的每个数据都是原来n个数据的线性组合，然后从新的数据中选出少数几个，使其尽可能多地反映各类模式之间的差异，而这些特征间又尽可能相互独立，则比单纯的选择方法更灵活、更有效。 K-L变换就是一种适用于任意概率密度函数的正交变换。 5.3 离散K-L变换我们在前面的特征选取中，从最终的结果来看，无非就是从n个测量值中选出了m个作为特征分量。从而就丢掉了n－m个分量，这一丢实际上就是丢掉了n－m个分量所带的信息。下面给大家介绍的K-L正交变换，就能够把n个测量信息都充分的利用起来,并且力图保持，变换后的n分量特征是相互独立的。这是我们讨论K-L变换的两个目标。 5.3 离散K-L变换 5.3.1 离散的有限K-L展开展开式的形式有一连续的随机实函数用一已知的正交函数集的线性组合来展开: 是正交函数，满足正交性条件：而aj是展开式的随机系数 5.3.1 离散的有限K-L展开将展开式写成离散形式，即将连续的随机函数和连续的正交函数在定义域内等间隔的采样为n个离散点写成向量的形式：取前面m项，做近似其中 5.3.1 离散的有限K-L展开在这里我们可以将向