模式识别课件(第4章 NO1)(线性判别函数).pptVIP

下载本文档

1
0
约7.18千字
约 37页
2018-04-28 发布于湖北
举报
版权申诉

模式识别课件(第4章 NO1)(线性判别函数).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模式识别课件(第4章 NO1)(线性判别函数)

* * * * * * * * * * * * 四 Fisher线性判别　构造Fisher判别函数　　　　　　　　　　　　　　（y为一维，X为d维） (注意：“判别函数”指的是任一X的函数)　希望投影后，在一维Y空间里，各类样本尽可能分得开些，即希望类间离散度　越大越好；而希望各类样本内部尽量密集，即希望类内离散度　越小越好。据此定义Fisher准则函数　　　式中JF(w)为标量(因为 , , 均是标量)　　　　现在的问题就是选择合适的W(方向)使尽可能的达到极大。　将变成W的显函数，即将　，　，　　　的式子代入　式得:　　　这是广义Rayleigh商/比，其有如下性质： ① = (α是一个实数) ② 的极值与W的大小无关，只与W的方向有关；利用Lagrange乘子法求使取极大值时的W*。由上性质②，可令分母为非零常数，　即　　　　构造Lagrange函数为： λ为Lagrange乘子，极大值的条件为：其中W*就是　　　的极值解。　因为　非奇异，所以上式两边左乘　　后得：　　　上式表明， W*是矩阵Sw-1 Sb相应于特征值λ的特征向量(对于两类问题，Sb的秩为１，所以Sw-1 Sb只有一个非零特征值，其所对应的特征向量W*称为Fisher最佳鉴别向量)。　　　由于目的是寻找最佳的投影方向，因此可略去比例因子故得：　W*就是使Fisher准则函数JF(W)取极大值时的解，也就是d维X空间到一维y空间的最佳投影方向。或述W*就是使样本的投影在类间最分散，类内最集中的最优解，有了W*后，得： y = W*TX (y∈Yi, x∈Xi) 即可将各样本由d维空间投影到一维空间，即直线W*上，变成一维样本。五 Fisher判别函数　由于变换后的样本是一维的，所以判别界面实际上是各类样本所在投影轴上的一个点，可以根据训练样本确定一个阀值　，从而Fisher判别规则为：　　当　　　　时，　　当　　　　时，　　　　判别阈值可取两个类心在w方向上轴的投影连线的中点作为阈值。即　容易推得：也可考虑类的先验概率情况下，这时 * * * * * * * * * * * * * * * * * * * * * * * * * 第4章　线性判别函数 4.1　引言 (1) 问题：第3章所述的分类器设计方法是在已知类条件概率密度p(X|Wi)和先验概率p(Wi)，再利用Bayes公式将其转化成后验概率。然后依据不同规则进行分类－－相对最优。但实际中，p(X|Wi)很难确定，而Parzen窗等估计方法又需大量样本，且随着特征空间Ω维数的增加所需样本数急增，导致计算量增加，存储量增加。 (2) 应对与局限性：因此，提出了利用样本集直接设计分类器。这种方法是：若能找到一个分离函数，特别若是不依赖于条件分布密度的，且呈线性或非线性的分离函数。它可理解为通过几何的方法，将Ω分解为对应于不同类别的子空间。这种方法所能处理的只是确定可分(线性/非线性可分)的问题，当样本集聚的空间发生重叠现象时，寻找分离函数的迭代过程将加长，甚至振荡。这就是这种方法的局限性。另外，相对Bayes方法该方法得到的是“次优解”。 (3) 这种方法的基本思想是：　如果根据以往大量的观察： ① 知道模式类别的分布； ② 能找出d维空间(Ω)中模式类之间的分界。这就能解决模式的分类问题。这实际上是运用已知类别的训练样本进行学习的过程。通过学习产生若干个代数界面g(X)=0，这个表示界面的函数g(X)称为判别函数。 (4) 这种方法的处理思路是：分类　特征空间的分划　寻求子区域的界面判别函数g(X) 　判别函数g(X)的结构与参数的确定待识别样本特征向量带入判别函数后取值与归类。注意：这种方法要求以后的待分类样本/模式基本上不超过学习样本的分布范围，也就是说利用这些已知样本得出的分类边界是无误差的。为了找出这些模式类之间的分界面，可以利用判别函数来进行。 (5) 处理方法是：先给定(某个)判别函数类g(X)=0，再利用样本集确定出g(X)中的未知参数，然后对于样本根据其特征值带入g(X)后