- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
径向基核函数 Radial Basis Function)–RBF
径向基核函数 (Radial Basis Function)–RBF
发表于297 天前 ? 技术, 科研 ? 评论数 8 ? 被围观 3526 views+
论文中又提到了RBF,虽然是个简单的核函数,但是也再总结一下。关于SVM中的核函数的选择,比较简单和应用比较广的是RBF。
所谓径向基函数 (Radial Basis Function 简称 RBF), 就是某种沿径向对称的标量函数。 通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数 , 可记作 k(||x-xc||), 其作用往往是局部的 , 即当x远离xc时函数取值很小。
最常用的径向基函数是高斯核函数 ,形式为 k(||x-xc||)=exp{- ||x-xc||^2/(2*σ)^2) } 其中xc为核函数中心,σ为函数的宽度参数 , 控制了函数的径向作用范围。
建议首选RBF核函数,因为:
能够实现非线性映射;( 线性核函数可以证明是他的一个特例;SIGMOID核函数在某些参数上近似RBF的功能。)
参数的数量影响模型的复杂程度,多项式核函数参数较多。
the RBF kernel has less numerical difficulties.
———–那么,还记得为何要选用核函数么?———–
对于这个问题,在Jasper’s Java Jacal博客《SVM入门(七)为何需要核函数》中做了很详细的阐述,另外博主对于SVM德入门学习也是做了很详细的阐述,有兴趣的可以去学习,丕子觉得这个文章写得相当好,特意转载了过来,留念一下。
如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必然使得它的适用范围大大缩小,而它的很多优点我们实在不原意放弃,怎么办呢?是否有某种方法,让线性不可分的数据变得线性可分呢?
例子是下面这张图:
我们把横轴上端点a和b之间红色部分里的所有点定为正类,两边的黑色部分里的点定为负类。试问能找到一个线性函数把两类正确分开么?不能,因为二维空间里的线性函数就是指直线,显然找不到符合条件的直线。
但我们可以找到一条曲线,例如下面这一条:
显然通过点在这条曲线的上方还是下方就可以判断点所属的类别(你在横轴上随便找一点,算算这一点的函数值,会发现负类的点函数值一定比0大,而正类的一定比0小)。这条曲线就是我们熟知的二次曲线,它的函数表达式可以写为:
问题只是它不是一个线性函数,但是,下面要注意看了,新建一个向量y和a:
这样g(x)就可以转化为f(y)=a,y,你可以把y和a分别回带一下,看看等不等于原来的g(x)。用内积的形式写你可能看不太清楚,实际上f(y)的形式就是:
g(x)=f(y)=ay
在任意维度的空间中,这种形式的函数都是一个线性函数(只不过其中的a和y都是多维向量罢了),因为自变量y的次数不大于1。
看出妙在哪了么?原来在二维空间中一个线性不可分的问题,映射到四维空间后,变成了线性可分的
!因此这也形成了我们最初想解决线性不可分问题的基本思路——向高维空间转化,使其变得线性可分。
而转化最关键的部分就在于找到x到y的映射方法。遗憾的是,如何找到这个映射,没有系统性的方法(也就是说,纯靠猜和凑)。具体到我们的文本分类问题,文本被表示为上千维的向量,即使维数已经如此之高,也常常是线性不可分的,还要向更高的空间转化。其中的难度可想而知。
小Tips:为什么说f(y)=ay是四维空间里的函数?
大家可能一时没看明白。回想一下我们二维空间里的函数定义g(x)=ax+b变量x是一维的,为什么说它是二维空间里的函数呢?因为还有一个变量我们没写出来,它的完整形式其实是y=g(x)=ax+b即y=ax+b看看,有几个变量?两个,二维。再看看f(y)=ay里面的y是三维的变量,再加上f(y)成为四维的了。
用一个具体文本分类的例子来看看这种向高维空间映射从而分类的方法如何运作,想象一下,我们文本分类问题的原始空间是1000维的(即每个要被分类的文档被表示为一个1000维的向量),在这个维度上问题是线性不可分的。现在我们有一个2000维空间里的线性函数
f(x’)=w’,x’+b
注意向量的右上角有个 ’哦。它能够将原问题变得可分。式中的 w’和x’都是2000维的向量,只不过w’是定值,而x’是变量(好吧,严格说来这个函数是2001维的,哈哈),现在我们的输入呢,是一个1000维的向量x,分类的过程是先把x变换为2000维的向量x’,然后求这个变换后的向量x’与向量w’的内积,再把这个内积的值和b相加,就得到了结果,看结果大于阈值还是小于阈值就得到了分类结果。
你发现了什么?我们其实只关心那个高维空间里内积的值,那个值算出来了,分类结果就算出来了。而从理论上说, x’
您可能关注的文档
- 建议2010《理信息系统》复习大纲.doc
- 建设工程专业分合同(示范文本).doc
- 建设工程施工分包安全协议书.doc
- 建设工程施工合[范文].doc
- 建设工程有限空作业规定.doc
- 建设工程经济公汇总.doc
- 建设工程造价管基础知识模拟试题.doc
- 开关变压器第一 变压器基本概念与工作原理.doc
- 建设工程造价管学习附录.doc
- 开发与利用综合学习资源.doc
- 专题03 阅读理解(讲练)(解析版)-A4.docx
- 专题03 阅读理解(讲练)(原卷版)-A4.docx
- 专题13 阅读理解A篇(16区一模新题速递)(解析版)-A4.docx
- 北师大版 第11讲 线段、射线、直线 (知识清单+16大题型+好题必刷)(解析版)-A4.docx
- 年终总结汇报PPT模版 (263).pptx
- 工作总结汇报PPT模板 (972).pptx
- 工作总结汇报PPT模板 (172).pptx
- 2026版《金版教程》高考一轮复习语文教材古文筑基卷5 《六国论》+《〈论语〉十二章》+《大学之道》《人皆有不忍人之心》+《〈老子〉四章》.pptx
- 2026版《课堂新坐标》高三历史一轮复习江苏专版25第二编第六单元第19讲全民族浴血奋战与抗日战争的胜利.pptx
- 2018栖慕堂餐饮品牌形象整合设计方案.pptx
最近下载
- 社区教育考试题及答案.doc VIP
- 污水处理优化软件:SuperPro Designer二次开发_(5).设备与物料流管理.docx VIP
- MSS SP-25中文 国外国际规范.pdf VIP
- 医院信息互联互通标准化成熟度测评方案(2025年版).docx VIP
- 急危重患儿的急救与护理.pptx VIP
- 七年级数学上册-难点探究:整式中的规律探究问题压轴题七种模型全攻略(原卷版).pdf VIP
- 2025年消防月全员消防安全知识培训.pptx VIP
- 第10课 帝制复辟与军阀割据 学案(含答案)历史统编版八年级上册.pdf VIP
- JBT11699-2013高处作业吊篮安装、拆卸、使用技术规程.pdf VIP
- 艾梅乙防治知识培训课件.pptx
原创力文档


文档评论(0)