线性口袋算法改进了线性感知器算法.docVIP

下载本文档

10
0
约5.87千字
约 13页
2016-09-18 发布于北京
举报
版权申诉

线性口袋算法改进了线性感知器算法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

线性口袋算法改进了线性感知器算法

线性口袋算法改进了线性感知器算法，能够直接处理线性不可分问题 1、SVM从线性可分情况下的最优分类面发展而来。H为分类线,H1, H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。推广到高维空间，最优分类线就变为最优分类面。 2、最优分类面就是要求分类线不但能将两类正确分开(训练错误率为0),且使分类间隔最大。 3、SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,也就是寻找一个分类面使它两侧的空白区域(margin)最大。 4、过两类样本中离分类面最近的点且平行于最优分类面的超平面上H1,H2的训练样本就叫做支持向量。 2、广义最优分类面假定训练数据可以被一个超平面分开我们进行正归化此时分类间隔等于使最大间隔最大等价于使最小我们可以对它进行归一化，使得所有样本都满足，即离分类面最近的样本满足，这样分类间隔就等于。因此要求分类间隔最大，就是要求最小。而要求分类面对所有样本正确分类，就是要求满足。因此，满足上面公式且使最小的分类面就是最优分类面。最优分类面问题可以表示成约束优化问题 Minimize Subject to 定义Lagrange函数求偏导：得将上式代入拉格朗日函数，消去w和b得到原问题的Wolf对偶（Dual）问题：可调用Matlab中的二次规划程序，求得(1,(2,(3,(4的值，进而求得w和b的值。而分划超平面仅仅依赖于为零的训练点，而与对应于为零的那些训练点无关。很多情况下，训练数据集是线性不可分的，Vapnik等人提出了用广义分类面（松弛子）来解决这一问题。非线性问题——通过非线性变换将它转化为某个高维空间中的线性问题，在这个高维空间中寻找最优分类面。近似线性可分：当最优分类面不能把两类点完全分开时（线性不可分），如果希望在经验风险和推广性能之间求得某种均衡，则可以通过引入超松弛因子ξ，允许错分样本的存在，此时的分类面满足：两个目标：1.间隔尽可能大2.错划程度尽可能小当时，样本点正确分类；当时，样本点被错分。因此，引入一个惩罚参数，新的目标函数变为: 体现了经验风险，而则体现了表达能力。所以惩罚参数实质上是对经验风险和表达能力匹配一个裁决。当时，近似线性可分SVC的原始问题退化为线性可分SVC的原始问题。用间隔定量地定义了置信风险：间隔越大，置信风险越小，间隔越小，置信风险越大用参数C实现了经验风险与置信风险的折中最优分类超平面只由少数支持向量决定，问题具有稀疏性模型为凸二次规划模型，没有陷入局部最优解的问题，任何局部最优解都是全局最优解通过使用核方法，具备了强大的非线性处理能力注：问题具有稀疏性是指决策时可以不管非支持向量的样本，而仅用到少数支持向量样本。注意训练时还是用到了所有的样本。核函数 SVM中不同的内积核函数将形成不同的算法,主要的核函数有三类：多项式核函数得到q阶多项式分类器。径向基函数 S形函数对非线性分类问题，若在原始空间中的简单最优分类面不能得到满意的分类结果，则可以通过非线性变换转化为某个高维空间的线性问题，在变换空间求最优分类面，SVM通过核函数变换，巧妙地解决了这个问题。如何针对不同的问题选择不同的核函数仍然是一个悬而未决的问题。由于寻找最优分类面函数只涉及到训练样本之间的点积运算，所以将样本映射到高维空间H时，算法仅使用H空间中的点积，而没有单独出现。能够找到一个函数K使得，这种点积运算是可以在原空间中的函数实现的，甚至没有必要知道变换的形式。根据泛函的有关理论，只要一种核函数满足Mercer条件，它就对应某一种变换空间中的点积。引入内积函数之后，目标函数式变为：相应的分类函数式变为： Mercer条件对于任意的对称函数，它是某个特征空间中的内积运算的充要条件是，对于任意的。在最优分类面中采用适当的内积函数就可以实现某一非线性变换后的线性分类,而计算复杂度却没有增加。其中，是模型的解。这就是支持向量机。概况地说，支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间，在这个空间中求最优分类面。支持向量机(support vector machines)是由贝尔实验室研究者Vapnik于 20世纪90年代最先提出的一种新的机器学习理论，是建立在统计学习理论的VC维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷，以期获得最好的推广能力。统计方法是从事物外在的表现去推断该事物可能的规律性。统计学习理论是针对小样本情况下的机器学习理论，它依据算法的经验风险以及算法本身的构造来推测它的实际风险，并获得较好的泛化能力。统计学习理论将算法的训练过程看作算