- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
svm在不平衡样本集中的应用研究 advances in unbalanced data sets by svm
第35卷(2007)第10期 计算机与数字工程 2l
SVM在不平衡样本集中的应用研究’
姚程宽
(安庆医药高等专科学校安庆246052)
Vector
摘要Vapnik等人提出基于统计学习理论的支持向量机(sVM,s“pponMacllic鹪)算法,将其运用于模式识
别中,取得了较好的效果。但传统的svM算法针对不平衡样本集时,效果很不理想,很多的科研人员对该问题进行广泛而
深入的研究,较为系统的回顾这一个研究分支在过去10年的发展动态。
关键词支持向量机不平衡数据集统计学习理论
中图分类号T∞1
两类间的间隔,可降低分类器的Vc维,实现结构
1 引言
风险最小化原则,最小化目标函数的第二项相当于
V印n-k等人在基于统计学习理论的基础上提经验风险最小化。上述二次规划的对偶形式为:
出的支持向量机(svM)算法”-4J,算法采用结构 f ● ‘
M“lIliza— max丕%一寺。三.a。叶y一乃(缸。勺) r,、
风险最小化原则(sRM,stnlctu瑚Risk 、‘,
f
don),综合考虑经验风险和置信范围,使分类器不 s.t. 三a。九20,O≤d。茎c
仅有较好的分类性能和较好的推广性。算法晟终
a;为hgrange乘子。根据最优化理论中的KKT条
是求解一个凸二次规划问题,与向量的维数无关,
件,只有少量样本(判决函数值等于±1的样本和
从而避免了传统人工智能算法的很多问题。
错分样本)的a。值不为零,Vapnik等人称之为支持
样本集的不平衡性主要是指某些类的样本数
向量,这便是支持向量机名称的由来。这种原始
量多余其他类的样本数量。目前对不平衡样本集
类型的sVM有时也称为从c_sVc。
的研究的方法主要有两个大的方向:
由于对偶形式(1)中只出现两向量间的内积
·从数据集角度,即重构数据集。
·从算法角度,即改进算法,SVM算法是众多
(q,x,)来代替内积运算(以·≈),实现线性算法的
人工智能算法其中的一种。
非线性化。常用的核函数包括:多项式核,径向
本文介绍与上述两个方向紧密相关的新进展
基核以及二层神经网p4J.核形式的判别函数为
(本文中的。正类”代表少类,“负类”代表多类)。 f
,(z)=蓦a;y.t(气,鼍)+6 (3)
2原始的支持向量机算法
3针对不平衡样本集的处理方法
支持向量机最初形式为二次规划问题:
1 . f 3一支持向量机的变形算法
min寺Ilw旷+c玉矗 …
‘ …
您可能关注的文档
- gsm长短信pdu编码分析 gsm long-sms pdu coding analyses.pdf
- h.264到avs快速视频转码技术研究 research on video transcoding from h.264 to avs.pdf
- h.264avc全零块检测算法原理及性能分析 analysis of principle and performance about azb detection algorithm for h.264avc.pdf
- go法在软件体系结构可靠性分析中的应用 application of the go methodology in reliability analysis of software architecture.pdf
- hcsim一种长期高频block-level快照索引技术 hcsim an indexing method for long-lived frequent block-level snapshot.pdf
- hadoop mapreduce短作业执行性能优化 performance optimization for short job execution in hadoop mapreduce.pdf
- ieee 802.11n mac性能优化策略分析 an analysis of the ieee 802.11n mac performance optimization strategy.pdf
- ieee 802.11p车载自组网络协议的edca自适应退避算法研究 research of the edca self-adaptive backoff algorithm for ieee 802.11p vanet protocol.pdf
- ieee802.11n聚合机制的研究与性能分析 performance evaluation of aggregation mechanisms for ieee 802.11n.pdf
- ieee802.11无线局域网中基于最优窗口的退避算法 optimal window based backoff algorithm for ieee 802.11 wlans.pdf
- 1.1细胞是生命活动的基本单位课件-2024-2025学年高一上学期生物人教版必修1.pptx
- 1.2细胞的多样性和统一性第1课时课件-2024-2025学年高一上学期生物人教版必修1.pptx
- 第16课《白杨礼赞》课件-2025-2026学年统编版语文八年级上册.pptx
- 2026届高三生物一轮复习课件+减数分裂与生物的遗传、变异.pptx
- 3.1细胞膜的结构和功能第2课时课件-2025-2026学年高一上学期生物人教版必修1.pptx
- 2025届高三生物一轮复习课件2.1减数分裂和受精作用.ppt
- 中考语文二轮专题复习课件:新闻概括题.pptx
- 第6课《我看》课件+++2025-2026学年统编版语文九年级上册.pptx
- 第21课《人民英雄永存不朽》课件-2025-2026学年统编版语文八年级上册.pptx
- 2025年广西河池罗城特聘农机技术指导员的(1人)考前自测高频考点模拟试题含答案详解(b卷).docx
文档评论(0)