- 7
- 0
- 约4.17千字
- 约 38页
- 2019-07-13 发布于湖北
- 举报
支持向量机( support vector machine,SVM) Outline SVM的理论基础 线性判别函数和判别面 最优分类面 支持向量机 SVM的研究与应用 SVM的理论基础 传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。 传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。 推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。 过学习问题 “过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。 例如:对一组训练样本(x,y),x分布在实数范围内,y取值在[0,1]之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0。 SVM 根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。 Vapnik 提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。 形成时期在1992—1995年。 SVM 由于SVM 的求解最后转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解。 SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 Joachims最近采用SVM在Reuters-21578来进行文本分类,并声称它比当前发表的其他方法都好。 Outline SVM的理论基础 线性判别函数和判别面 最优分类面 支持向量机 SVM的研究与应用 线性判别函数和判别面 一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 两类情况:对于两类问题的决策规则为 如果g(x)0,则判定x属于C1, 如果g(x)0,则判定x属于C2, 如果g(x)=0,则可以将x任意 分到某一类或者拒绝判定。 线性判别函数 下图表示一个简单的线性分类器,具有d个输入的单元,每个对应一个输入向量在各维上的分量值。该图类似于一个神经元。 超平面 方程g(x)=0定义了一个判定面,它把归类于C1的点与归类于C2的点分开来。 当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)。 当x1和x2都在判定面上时, 这表明w和超平面上任意向量正交, 并称w为超平面的法向量。 注意到:x1-x2表示 超平面上的一个向量 判别函数g(x)是特征空间中某点x到超平面的距离的一种代数度量 ?从下图容易看出 g(x) = r*||w|| 上式也可以表示为: r= g(x)/||w||。 当x=0时,表示原点到超平面的距离,r0= g(0)/||w||=w0/||w||,标示在上图中。 多类的情况 利用线性判别函数设计多类分类器有多种方法。例如 可以把k类问题转化为k个两类问题,其中第i个问题是用线性判别函数把属于Ci类与不属于Ci类的点分开。 更复杂一点的方法是用k(k-1)/2个线性判别函数,把样本分为k个类别,每个线性判别函数只对其中的两个类别分类。 广义线性判别函数 在一维空间中,没有任何一个线性函数能解决下述划分问题(黑红各代表一类数据),可见线性判别函数有一定的局限性。 广义线性判别函数 如果建立一个二次判别函数g(x)=(x-a)(x-b),则可以很好的解决上述分类问题。 决策规则仍是:如果g(x)0,则判定x属于C1,如果g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。 广义线性判别函数 广义线性判别函数 设计线性分类器 Fisher线性判别方法 如:Fisher线性判别方法,主要解决把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。 然而在d维空间分得很好的样本投影到一维空间后,可能混到一起而无法分割。 但一般情况下总可以找到某个方向,使得在该方向的直线上,样本的投影能分开的最好。 目的是降维,在低维空间中分割 Outline SVM的理论基础 线性判别函数和判别面 最优分类面 支持向量机 SVM的研究与应用 最优分类面 SVM 是从线性可分情况下的最优分类面发展而来的, 基本思想可用图2的两维情况说明. 最优分类
您可能关注的文档
- 太阳能电池组件培训——2011924.ppt
- PM项目管理系统培训.ppt
- 室内空气污染的主要元凶及应对措施.pptx
- 热点篇资本市场解读广东詹艳.ppt
- 耶鲁大学课程——哲学死亡17简体字幕.doc
- 班组长自我角色认知.ppt
- 超市无线传输解决方案V1.doc
- 江西省居民消费水平主要影响因素分析.doc
- 银浆新技术应用及用量.ppt
- HPLC法测定加拿大紫杉中紫杉醇的含量.doc
- 腾讯安全沙龙:红队视角下的海外SRC猎场:战略、战术与突破.pdf
- 【icap】ETS的范围扩展:设计和政策挑战.docx
- bcg -美国最高法院关于关税的裁决对你的企业意味着什么 What Does the US Supreme Court Ruling on Tariffs Mean for Your Business.pdf
- 2026届甘肃兰州市高三下学期第一次模拟考试历史试卷(扫描版,含答案).docx
- bcg -零售银行如何让人工智能代理发挥作用 How Retail Banks Can Put AI Agents to Work.pdf
- 住宅项目规范解读(GB 55038-2025) -培训 - 房地产-2025.docx
- 盘扣式脚手架工程量自动计算表 -培训 -房地产-2025.pdf
- 广东省汕头市2024-2025学年高三下学期第一次模拟考试英语学试题(含答案).docx
- 品牌研究+_+2025+CAPSE中国航司品牌榜单.pdf
- 【银河专题】如何看待豆粕内外价差关系.pdf
最近下载
- TFD模型和余氏理论对材料设计的应用.pdf VIP
- 2026江苏苏豪控股集团校招面笔试题及答案.doc VIP
- 2025年河南省中考题数学试题(原卷版+解析版).pdf
- 东方神女山鬼系列全集(26页).docx VIP
- 《薄层液基细胞学检查与HPV分型检测在宫颈疾病筛查中的应用》.docx VIP
- 2025 呼吸内科疑难病例医学查房实践课件.pptx VIP
- 2024年安徽工贸职业技术学院单招职业适应性测试题库及答案解析.docx VIP
- 分析化学武汉大学第五版课件(全).ppt VIP
- 《金属非金属矿山安全检查工》课件.ppt VIP
- 2025年安徽工贸职业技术学院单招职业适应性测试题库及答案解析.docx VIP
原创力文档

文档评论(0)