第三章判别函数分类器.pptVIP

下载本文档

2
0
约2.62千字
约 52页
2019-07-20 发布于广东
举报
版权申诉

第三章判别函数分类器.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章判别函数分类器矢量矢量X可以看作是N维欧氏空间中的一个点，用一个列矢量表示：矩阵矩阵可以看作是由若干个矢量构成的：矩阵的秩矩阵所有行向量的最大无关组个数称为行秩；矩阵所有列向量的最大无关组个数称为列秩；一个矩阵的行秩等于列秩，称为矩阵的秩。转置列矢量W的转置WT为一个行矢量； N*M的矩阵A的转置AT为一个M*N的矩阵。矢量与矢量的乘法(1) 设W和X为N维列矢量矢量与矢量的乘法(2) 设W和X为N维列矢量矢量与矩阵的乘法设W为N维列矢量，A为一个N*M的矩阵：正交设W和X为N维列矢量，如果W与X的内积等于零：逆矩阵 A为一个N*N的方阵，A的逆阵用A-1表示，满足：矩阵的特征值和特征向量 A为一个N*N的方阵，如果有：矩阵的迹和行列式值 A为一个N*N的方阵，A的迹为主对角线元素之和：矩阵的迹、行列式值与特征值之间的关系矩阵A有N个特征值?1，?2，…， ?N，则有如下关系：矩阵对数值变量微分矩阵A(t)=[aij(t)]M*N，元素aij(t)是变量t的函数，矩阵A(t)对t的微分：矩阵函数对矩阵的微分矩阵X=(xij)M*N，M*N元函数f(X)，定义f(X)对矩阵X的导数：常用矢量微分的性质 X和W为N维矢量，A为M*N的矩阵： 3.1 线性判别函数一、两类问题二、多类问题两类问题的线性判别函数 X0=(x1, x2,…, xN)T为待识模式的特征矢量； W0=(w1, w2, …, wN)T称为权矢量。线性判别函数的增广形式 X=(x1, x2,…, xN, 1) T称为增广的特征矢量； W=(w1, w2, …, wN , 1)T称为增广的权矢量。两类问题线性判别准则多类问题（情况一）每一类模式可以用一个超平面与其它类别分开；这种情况可以把M个类别的多类问题分解为M个两类问题解决；多类问题（情况一）多类问题（情况一）判别规则当d1(X)≥0，而d2(X)0且d3(X)0时，判别X属于Ω1；当d2(X)≥0，而d1(X)0且d3(X)0时，判别X属于Ω2；当d3(X)≥0，而d1(X)0且d2(X)0时，判别X属于Ω3；其它情况，拒识。多类问题（情况二）每两类之间可以用一个超平面分开，但是不能用来把其余类别分开；需要将M个类别的多类问题转化为 M(M-1)/2个两类问题。第i类与第j类之间的判别函数的为：多类问题（情况二）判别准则如果对任意j≠i ，有dij(X) )≥0 ，则决策X属于?i。其它情况，则拒识。多类问题（情况二）多类问题（情况三）情况三是情况二的特例，不存在拒识区域。多类问题（情况三）判别函数 M个类别需要M个线性函数： 3.2 两类别线性判别函数的学习一、问题的表达二、感知器算法三、最小均方误差算法(LMSE) 问题的表达已知两个类别的训练样本集合：问题的表达矩阵形式描述权矢量的解只有当样本集线性可分的条件下，解才存在；线性不等式组的解是不唯一；感知器算法的思想感知器算法初始化，置W(1)中的元素为一个小的随机数；在第k步学习训练样本Xk，按照如下公式修正权值W： LMSE算法的思想此方法也称为Ho-Kashyap算法(H-K算法) 将线性不等式组XW≥0的问题，转化为解线性方程组XW=B的问题。其中：B=(b1, b2, …, bN)T，bi≥0 问题求解已知：增广矩阵X(可由训练样本集得到)；求：W和B。 X一般不是方阵，所以问题实际上无解，只能求近似解。优化的准则函数定义误差矢量e：梯度法求解上面两个公式成立的W即为所求。 H-K算法由训练样本集计算X，X*=(XTX)-1XT；初始化 B(0)，每个分量是一个小的正值，选常数C，置k=0；计算W(k)=X*B(k)，e(k)=XW(k)-B(k)；若e(k)=0，停止迭代，输出W=W(k)；若e(k)≤0，停止迭代，线性不可分；其它情况，继续第5步； H-K算法迭代计算： 3.3 多类别线性判别函数的学习情况一：M类问题转化为M个两类问题：?i样本作为一类，其它样本作为另一类进行训练；情况二：M类问题问题转化为M(M-1)/2个两类问题， ?i样本作为一类， ?j样本作为另一类，训练Wij；多类问题情况三采用扩展的感知器算法初始化L个权向量Wi(1)，选择常数C，置步数k=1；输入增广特征矢量Xk，计算L各判别函数的输出：扩展的感知器算法修改权矢量，规则为：若Xk属于?i，并且di(Xk)dj(Xk)，对任意的j≠i，则： W i(k+1)=W i(k)，i=1,…,L