[工学]线性判别函数.pptVIP

下载本文档

18
0
约9.34千字
约 68页
2018-03-09 发布于浙江
举报

[工学]线性判别函数.ppt

[工学]线性判别函数

分段线性判别函数设计中首先要解决的问题：分段线性判别函数的分段段数问题，这是一个与样本集分布有关的问题。分段段数过少，就如上图中用一个线性判别函数(段数为1)的情况，其分类效果必然要差；但段数又要尽可能少，以免分类判别函数过于复杂，增加分类决策的计算量。在有些实际的分类问题中，同一类样本可以用若干个子类来描述，这些子类的数目就可作为确定分段段数的依据。但多数情况下样本分布及合适子类划分并不知道，则往往需要采用一种聚类的方法将样本划分成相对密集的子类，然后用各种方法设计各段线性判别函数。分段线性判别函数的一般形式可定义为： (4.8-1) 其中表示第i类第l段线性判别函数，li为i类所具有的判别函数个数，与分别是第l段的权向量与阈值权。相应的判别规则是：其中： (4.8-2) 则决策：则称为第i类的判别函数。决策面方程取决于相邻的决策域，如第i类的第n个子类与第j类的第m个子类相邻，则由它们共同决定的决策面方程为: (4.8-3) 基于距离的分段线性判别函数前面讨论过正态分布条件下，两类别问题在各特征统计独立、同方差、且先验概率相等情况下，最小错误率决策可按最小距离决策，即 (4.8-4) 其中与为各类的均值。基于距离的线性判别 (a) (b) 图(a)用每个类的特征向量的均值作为各类的代表点图(b)先把各类分成分布相对集中的几个子类，每个子类用子类的特征向量的均值作为各类的代表点。即：如果对于ωi有li个子类，则有li个代表点，或者说把属于ωi的决策域Ri分成li个子域，即对每个子区域Ril均值用mil表示，并以此作为该子区域的代表点，则判别函数定义为：判别规则是：这种分类器就称为分段线性距离分类器。对感知器算法修改为： ① 置k=0，选初值w(0)=0，c=1，给较小正数T。 ② 输入训练样本 xk, ③ 计算： ④ 判断：若 ,返回②，否则继续。 ⑤ 令若所有样本均不进入⑤，则算法结束。从算法中可以看出：返回② 两边乘以解向量w*: (由算法的③④知道) 由于：归一化： 4.4 感知器 4.4 感知器因此：分别计算出代入上式得：令：c(k)表示两个向量w*与w(k)之间的夹角余弦，则：又因为：，令：则有：所以，k是一个有限的值，步骤⑤仅需有限次数就可以得到w*。即在线性可分的情况下，感知器训练算法一定收敛。正数T越小，则收敛越慢(k值越大)。 4.4 感知器感知器训练算法在多类问题中的应用(推广) 在前面介绍的多类问题中的第三种情况是没有不确定区域的，对于c种类型中的某一种类型wi，存在k个判决函数，如果样本，则，其中k取决于在特征空间中与wi类型相邻的类型数目，。采用感知器训练算法求解上面这种情况的权向量的解向量w*，实现步骤为： ① 赋给初始值：分别赋给c个权向量任意的初值，选择正常数c，把训练样本变为增广型模式向量，置 k=0。 ② 输入训练样本，假定 ③ 计算c个判决函数值： ④ 修正权向量。修正规则为：若： 4.4 感知器若： ⑤ 令k=k+1，返回②。直到所有的权向量对所有训练样本都稳定不变时结束。只要模式样本线性可分，则算法迭代有限次后收敛。例：已知三类训练样本：w1=(0,0)T， w2=(1,1)T， w3=(-1,1)T 试求解，，。解：训练样本变成增广型模式向量： x的下标就是它所属类型，且没有一个样本乘以(-1)。置 K=0 , c=1。赋初值：开始迭代： ≯ ≯ 4.4 感知器所以： ≯ 所以： 4.4 感知器所以： ≯ ≯ 所以： 4.4 感知器所以：所以：因此，可得到3个解向量：对应的三个判决函数练习：根据上面的判决函数结果，求出各个分界面方程，并在坐标图上表示出来。 4.5 最小平方误差准则函数与H-K算法最小平方误差准则任意给定一个小的正数b，则可在线性判别方程的解区里寻找一个解向量w，使之满足：，假定有n个训练样本，则可以写成n个联立方程组：其中：上式方程组可化简为：，x为训练样本的增广矩阵： n1+ n2=n，则x为N×(d+1)维矩正，一般n(d+1)，b为n维列向量，w为d+1维列向量。求解w:(1)如果w是非奇异的，则：。(2)寻找

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

[工学]线性判别函数.pptVIP