- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于支持向量机算法的癌症预测.pdf
2007年7月 榆林学院学报 July.20ar7
OF
第17卷第4期 JOURNALYUUNC0眦GE V01.17No.4
基于支持向量机算法的癌症预测
吴疆1,董婷2
(1.榆林学院信息技术系;2.榆林学院计算机与网络工程系,陕西榆林,719000)
Vector
摘要:将支持向量机sVM(support
预报结果做比较,SVM对癌症数据的预测正确率迭到98%,推广能力明显强于KNN、神经网络等传统算法。
关键词:支持向量机;优化;核函数;超平面
中图分类号:TP30l
文献标识码:A文章编号:1008—3871(2007)04一0025—03
如何解决小样本学习问题的同时又能很好地限制过拟合问题是模式识别领域研究的一个热点问题[1】。
据的学习问题。SVM方法在理论上有突出的优势,贝尔实验室首先对美国邮政手写数据库识别用了SVM
方法旧1,取得了较大的成功。随后的几年里有关SVM的应用研究得到了很多领域的学者的重视,在人脸检
测、语音识别、手写字体识别、以及其它应用研究等方面取得了大量的研究成果.陈念贻等的《支持向量机一
微量元素分析法判别乌龙茶、红茶与绿茶》旧1报道了支持向量机与微量元素分析相结合,区别乌龙茶与其他
茶种的结果;包新华等的《支持向量机算法在熔盐相图数据库智能化中的若干应用》H1是支持向量机算法用
于相图预报和评估的一个范例;陆文聪的《支持向量机算法用于夜光藻密度建模》”1等大量文献都报道了支
持向量机算法在机器学习和模式识别领域显现出良好的推广能力和适应性,尤其在小样本的机器学习方面
有着传统的模式识别算法无法比拟的优越性,也可以说支持向量机算法必将取代神经网络成为人工智能、机
器学习、模式识别领域的研究热点MJ。
1支持向量机
1.1最优分类面SVM方法是从线性可分情况下的最优分类面(OptimalHyperplane)提出的。如图l所示
的二维两类可分情况时,图中实心点和空心点分别表示两类样本,H为把两类没有错误分开的分类线,H,,
H:分别为过两类样本中离分类线最近的点且平行于分类线的直线,H,和H:之间的距离叫做两类的分类空
到高维空间,最优分类线就成为最优分类面。
g(x)=w·x+b,分类面方程为:w·x+b=0 (1—1)
我们将判别函数进行归一化,使两类样本都满足l
w
样分类间隔就等于2川wI|,因此分类间隔最大等价于使11lf 2最小;而要使分类线对所有样本能正确分
类,要有如下约束条件:yi[(w·xi)+b]一1≥(1—2) .
因此满足上述条件且使得11w旷最小的分类面就是最优分类面。过两类样本中离分类面最近的点且
平行于最优分类面H。,H:上的训练样本就是式(1—2)中使等号成立的那些样本,它们叫做支持向量。
最优分类面可以表示成如下的约束优化问题,即在条件(1—2)的约束下,求函数:
1 1
w
D(w)=÷11lI 2=÷(w·w)的最小值。为此,可以定义如下的拉格朗日函数:
二 二
1 . “
L(w,b,a)={一I|w||2一∑ai{yi[yi(w·x)+b]一l} (1—3)
收稿日期:2006一12—04修回日期:2007—Ol—20
作者简介:吴疆(1981一),男,陕西榆林人,四川大学在读博士。
万方数据万方数据
·26· 榆林学院学报 2007年第4期(总第66期)
文档评论(0)