线性判别函数.pptVIP

下载本文档

27
0
约6.29千字
约 117页
2019-05-03 发布于江西
举报
版权申诉

线性判别函数.ppt

1、本文档共117页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

(3) 样本类间离散度 Fisher准则函数满足两个性质： (1) 投影后，各类样本内部尽可能密集，即总类内离散度越小越好 (2) 投影后，各类样本尽可能离得远，即样本类间离散度越大越好 Fisher准则函数为越大越好尽可能大越小越好 Fisher准则函数 Fisher准则函数是与训练样本向量、投影方向有关的非线性函数 2 求使Fisher准则函数到达最大的投影方向 w max 我们用Lagrange乘子法求 w 令上式中的分母等于非零的常数，即 Lagrange函数定义为 Lagrange乘子对w求偏导，并令其为零得最优解其中，w* 就是使Fisher准则函数取极大的解因为Sw是非奇异的，即存在逆矩阵Sw-1 两边都左乘逆矩阵Sw-1，则这是一个求矩阵 Sw-1 Sb 的本征值问题这里我们不直接解本征值问题，而是进一步简化公式令得标量意义：Sb w* 总是向量 (m1-m2) 的方向上因此有则忽视比例因子 R/λ ，得这就是使Fisher准则函数取极大值得最优解，即我们要找得最好的投影方向 3 分类阈值与决策规则通过定义Fisher准则函数和最大化准则函数，我们已经得到了最好的投影方向 w*。利用公式我们可以将 d 维空间的样本集 X 映射成一维空间的样本集 Y 。剩下的问题是找出一个阈值 y0将两类样本分开 y0 如何选取 y0 ? (1) 投影后均值的中心点 y0 y0 (2) 利用类先验概率，修正均值的中心点偏离先验概率大的类，靠近先验概率小的类 y0 (3) 投影后，全体样本均值 y0 (4) 如果投影后，两类样本是可分的（即没有样本混迭现象），取两类样本中最靠近的两个样本的中点从有限的实验效果来看： (4) (1) (3) 好差 Fisher线性判别分析的决策规则对于某一个未知类别的样本向量 x 如果则否则决策规则：对于某一个未知类别的样本向量 x 如果则否则定义判别函数 4 Fisher线性判断分析的设计步骤 (1) 已知两类问题的样本集 X (2) 计算两个类的均值向量 mi (3) 计算样本类内离散度矩阵 Si 和总类内离散度矩阵 Sw (4) 求出最好投影方向 w*=Sw-1(m1-m2) (5) 选取一个合适的阈值 y0 设计一个非线性的判别函数决策规则在一维特征空间中，x b 和 x a 的样本属于ω1，b x a 的样本属于ω2 设计一个非线性判别函数决策规则令则称为广义线性判别函数广义权向量评述：从理论上来说，对于任意判别函数，都可以利用泰勒级数来展开，取有限项得到高次判别函数。通过适当的变换，可以转化成广义线性判别函数。从而将一个复杂问题转化简单问题来解决。但是，实际应用中，可能导致维数的迅速增加，出现所谓的“维数灾难”问题（理论上可行、技术上不行）令广义线性判别函数的特例，称为线性判别函数的齐次简化增广样本向量，所属空间称为 Y 空间增广权向量或者广义权向量决策面方程：它通过 Y 空间（d+1维）的原点，但是，对 d 维子空间的划分与原始决策面方程（wTx+w0=0）对 X 特征空间的划分完全相同 X空间中决策面 Y空间中决策面距离的代数度量距离的代数度量 x1 x2 x1-5 =0 x1-5x2 =0 说明：在后面的讲课中，经常使用广义样本向量和广义权向量 Y 空间中某一点到新的超平面的代数距离是与原来的距离有差别，主要原因是分母变大，其值会缩小 4.1.3 设计线性分类器的主要步骤设计线性分类器：利用训练样本集建立线性判别函数或者广义线性判别函数，即确定线性判别函数中的权向量与阈值、或者广义线性判别函数中的广义权向量设计线性分类器的关键是：定义出一个适当的准则函数，准则函数的极值点对应于最好的权值向量与阈值（或者广义权向量）。这样，可以将分类器的设计转化成利用利用训练样本寻找准则函数的极值点的问题设计线性分类器的主要步骤 (1) 有一组具有类别标志的样本集根据将 xi 看成确定性观察值或者随机变量，相应地可以将上述样本集看成确定性样本集或者随机性样本集。有时，还需要将样本集 X 转化成增广样本集 Y (2) 根据实际情况，确定一个适当准则函数 J ，其必须满足两个条件： ① J 必须是样本集 X、权向量与阈值（或者广义权向量）的函数 ② J 的值要反映出分类器的性能，其极值则对应于“最好”的权向量与阈值（或者广义权向量），即“最好”的决策 (3) 用最优化技术求出准则函数的极值解求出这些最佳权向量与阈值、或者广义权向量后，可以建立判别函数和决策规则，然后对未知类别的样本进行分类线性分类器设计的流程有类别