基于尺度化凸壳的最大间隔分类方法分析-analysis of maximum interval classification method based on scaled convex hull.docx

基于尺度化凸壳的最大间隔分类方法分析-analysis of maximum interval classification method based on scaled convex hull.docx

基于尺度化凸壳的最大间隔分类方法分析-analysis of maximum interval classification method based on scaled convex hull

and the resulting classifier will tend to misclassify more positive points. By providing different SCH with a different scale factor, the imbalance can be addressed, i.e., providing the positive SCH with bigger scale factor and the two SCH will have the same area, and the resulting classifier will misclassify less positive points.In the same way, by providing different SCH with a different scale factor, the proposed SCH method can solve the cost-sensitive problems.In the last, by building the relationship between the SCH and the minimum enclosing ball (MEB) problems, the solution of SCH based classifiers can be transformed to the solution of MEB. By the existing methods to solve MEB problems,the large-scale classification problems can be resolved.Key words: Support vector machinesMaximal marginReduced convex hulls Scaled convex hullImbalanceCost-sensitiveMinimum enclosing ball独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名: 日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日1绪论支持向量机 (Support Vector Machines,缩写为 SVM)是 20 世纪 90 年代在统计学 习理论的基础上发展起来,并在模式识别、数据挖掘中发挥重要作用的一种机器学 习方法。传统的学习算法采用的是经验风险最小化准则,而 SVM 则因采用结构风险 最小化准则进行学习而具有良好的推广能力。此外,SVM 具有简洁的数学形式、直 观的几何解释,是一种解决分类、回归和概率密度估计等问题的有效方法。近年来, SVM 一直是机器学习领域的一个研究热点,并广泛应用于各种分类、识别问题。SVM 的特点及其良好的推广能力,也使得其基于最大化间隔的思想被越来越多地应用到 其他的学习问题中。1.1统计学习理论与支持向量机统计学习理论是 20 世纪 90 年代逐渐发展并成熟起来的一门不同于传统统计学 的理论,主要研究的是小样本情况下的统计学习规律,是对传统统计学的重要补充 和完善。它的建立是统计推断领域内的一个里程碑,并使得统计及其学习成为一门 具有严谨理论基础的科学。Vapnik[1,2]的两部专著的出版,更是极大地推动了统计学 习理论的发展。SVM 是建立在统计学习理论基础上的一种学习算法,其主要是通过 构造一个线性最优分类超平面将样本点正确分开,并使得它们之间的间隔(margin) 最大,这就是最大间隔准则[3]。机器学习的目的是根据给定的训练样本,求某系统对输入输出之间依赖关系的 估计,使它能够对未知输出做出尽可能准确的预测。机器学习一般可以表示为:假设样本变量 (x, y)存在一定的未知依赖关系即服从某一未知的联合概率 P(x, y) ,机器学习就是根据 n 个独立同分布观测样本(x1 , y1 ), (x2 , y2 ),K

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档