- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ch4非线性分类
第四章 非线性分类 5.1 分段线性分类器 5.1.1 分段线性判别函数 5.1.2 线性分类器的训练 5.1.1 分段线性判别函数 在实际中有很多模式识别问题并不是线性可分的,这时就需要采用非线性分类器。 比如当两类样本分布具有多峰性质并互相交错时,简单的线性判别函数往往会带来较大的分类错误。这时,树分类器作为一种分段线性分类器,常常能有效的应用于这种情况。本节重点讨论分段线性分类器的算法。 5.1.1 分段线性判别函数 如图所示两类样本不能用线性分类器分开, 但可用分段线性判别函数和二次判别函数分开。 5.1.1 分段线性判别函数 分段线性判别函数是一种特殊的非线性判别函数,它确定的决策面是由若干超平面段组成的。 由于它的基本组成仍然是超平面,因此,与一般超曲面相比是简单的;又由于它是由多段超平面组成的,所以它能逼近各种形状的超曲面,具有很强的适应能力。 1 基于距离的分段线性判别函数 1 基于距离的分段线性判别函数 1 基于距离的分段线性判别函数 1 基于距离的分段线性判别函数 1 基于距离的分段线性判别函数 3 分段线性分类器设计的一般考虑 分类器设计的基本问题是,在一定判别函数类内利用训练样本集确定分类器的参数,即确定判别函数中的系数。设计线性分类器,就是确定权向量 w 和阈值权 或广义权向量 a。而设计分段线性分类器,则是利用样本集确定一组 和 。下面我们分几种不同的情况来讨论这个问题。 (1) 子类数及子类划分已知 若已知样本的子类划分情况,可把子类看作独立的类,然后利用多类线性判别函数算法把各个子类分开,自然也就把各类分开了。 前提:已知子类划分。 划分子类的方法: 1) 根据先验知识直观判定,如字符识别中,可把同一字符看作一类,而把其中不同的字体看作它的不同子类。 2) 借助于聚类分析方法来解决。 2) 子类数已知,子类划分未知 利用下面的错误修正算法设计分段线性分类器,它与多类线性判别函数的固定增量算法很相似, 3) 未知子类数目 当每类应分成的子类数目也未知时,这是最一般的情况。在这种情况下,设计分段线性分类器的方法很多.下面介绍二分树分段线性分类器. 3)未知子类数目 树状分段线性分类器 5.1.2 局部训练产生分段线性分类器 1 算法基本思想 2 紧互对原型对与交遇区 3 局部训练法 4 决策规则 1 算法基本思想 这是一种实现最少分段线性分类器的方法。当两类样本非线性可分时,贝叶斯分界面一般通过两类样本十分靠近或相互交迭的区域,我们称之为“交遇区”。把这些区域找出来,利用这些区域中的样本作为新的样本集设计线性判别函数,然后把它们连在一起,就构成了一个分段线性判别函数。这种方法称为“局部训练法”,所得的分界面是分段线性分解面,它可以很好的逼近贝叶斯分界面。 1 算法基本思想 1 算法基本思想 2 紧互对原型对与交遇区 假设有两类样本集 X1 和X2,为找出交遇区,可先将每一类样本用聚类分析方法分为若干子集。每个子集在特征空间中占据一定区域,称为“原型区”,每个子集的重心,或最靠近重心的一个样本,称为该子集的“原型”。 2 紧互对原型对与交遇区 3 局部训练法 3 局部训练法 4 决策规则 4 决策规则 4 决策规则 4 决策规则 4 决策规则 4 决策规则 4 决策规则 5.2 二次判别函数 二次判别函数也是一种常用的非线性判别函数,而且它的适用范围比简单的线性判别函数要广。但是由于二次判别函数及其确定的分界面比较复杂,我们只简单介绍一下它的基本概念。 5.2 二次判别函数 定义:二次函数的一般表达式为 5.2 二次判别函数 二次判别函数确定的决策面是一个超二次曲面,包括超球面、超椭球面、超双曲面等。 5.2 二次判别函数 5.2 二次判别函数 (2)定义二次判别函数 5.2 二次判别函数 例:图中所示样本利用局部训练法产生了H1与H2两个超平面,将整个特征空间划分成R1、R2与 R3 三个决策域。 图中,R1域中第二类样本占绝大 多数,因此 R1 可以作为第二类样 本的决策域。同样,R3可以作为的 决策域。 问题出在 R2 域,两类样本均占相当 比例,因此不能简单地将其确定为哪 一类的决策域,而需要对其进一步划分。 假设分段线性分类器由 m 个超平面组成,其中每段 平面都可以表示为 设 时,即x 在 正侧时记为1,而 时 记为 0. 对于每个样本 x, 由m个超平面可以产生一个m 维、取 值为0或1的向量 , 其元素 为 于是 例如,若 m =
文档评论(0)