- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
svm 支持向量机 入门
svm 支持向量机 入门
svm(支持向量机)入门2011-04-25 10:42Why this tutorial is here
我一直觉得SVM是个很有趣的东西,不过也一直没办法(mostly冲堂)去听林智仁老师的Data mining跟SVM的课;后来看了一些网路上的文件跟听kcwu讲了一下libsvm的用法后,就想整理一下,算是对于并不需要知道完整SVM理论的人提供使用libsvm的入门。原始libsvm的README跟FAQ也是很好的文件,不过你可能要先对svm跟流程有点了解才看得懂(我在看时有这样的感觉);这篇入门就是为了从零开始的人而写的。
后来还有一些人提供意见,所以在此要感谢:
kcwu,biboshen,puffer,somi
不过请记得底下可能有些说法不一定对,但是对于只是想用SVM的人来说我觉得这样说明会比较易懂。
这篇入门原则上是给会写基本程式的人看的,也是给我自己一个备忘,不用太多数学底子,也不用对SVM有任何先备知识。
还看不懂的话有三个情形,一是我讲的不够清楚,二是你的常识不足,三是你是小白^;
我自己是以完全不懂的角度开始的,这篇入门也有不少一样不懂SVM的人看过、而且看完多半都有一定程度的理解,所以假设情况一不会发生,那如果不懂一定是后两个情况:P也所以,有问题别问我。
SVM:What is it and what can it do for me?
SVM,Support Vector Machine,简而言之它是个起源跟类神经网路有点像的东西,不过现今最常拿来就是做分类(classification)。也就是说,如果我有一堆已经分好类的东西(可是分类的依据是未知的!),那当收到新的东西时,SVM可以预测(predict)新的资料要分到哪一堆去。
听起来是很神奇的事(如果你觉得不神奇,请重想一想这句话代表什么:分类的依据是未知的!,还是不神奇的话就请你写个程式解解看这个问题),也很像要AI之类的高等技巧.不过SVM基于统计学习理论可以在合理的时间内漂亮的解决这个问题。
以图形化的例子来说明(by SVMToy),像假定我在空间中标了一堆用颜色分类的点,点的颜色就是他的类别,位置就是他的资料,那SVM就可以找出区隔这些点的方程式,依此就可以分出一区区的区域;拿到新的点(资料)时,只要对照该位置在哪一区就可以(predict)找出他应该是哪一颜色(类别)了:
原始资料分布
SVM找出来的区域
当然SVM不是真的只有画图分区那么简单,不过看上面的例子应该可以了解SVM大概在作什么.
要对SVM再多懂一点点,可以参考cjlin在data mining课的slides:pdfor ps。
底下我试著在不用看那个slide的情况解释及使用libsvm。
所以,我们可以把SVM当个黑盒子,资料丢进去让他处理然后我们再来用就好了.
How do Iget SVM?
林智仁(cjlin)老师的libsvm当然是最完美的工具.
Download libsvm
下载处:
.zip跟.tar.gz基本上是一样的,只是看你的OS;习惯上Windows用.zip比较方便(因为有WinZIP,不过我都用WinRAR),UNIX则是用.tar.gz Build libsvm
解开来后,假定是UNIX系统,直接打make就可以了;编不出来的话请详读说明和运用常识.因为这是tutorial,所以我不花时间细谈,而且会编不出来的情形真是少之又少,通常一定是你的系统有问题或你太笨了.其他的子目录可以不管,只要svm-train,svm-scale,svm-predict三个执行档有编出来就可以了.
Windows的用户要自己重编当然也是可以,不过已经有编好的binary在里面了:请检查windows子目录,应该会有svmtrain.exe,svmscale.exe,svmpredict.exe,svmtoy.exe.
Using SVM libsvm有很多种用法,这篇tutorial只打算讲简单的部分.
The programs
解释一下几个主要执行档的作用:(UNIX/Windows下档名稍有不同,请用常识理解我在讲哪个)
svmtrain Train(训练)data.跑SVM被戏称为开火车也是由于这个程式名而来.train会接受特定格式的输入,产生一个Model档.这个model你可以想像成SVM的内部资料,因为predict要model才能predict,不能直接吃原始资料.想想也很合理,假定train本身是很耗时的动作,而train好可以以某种形式存起内部资料,那下次要predict时直接把那些内部资料load进来就快多了.
svmpredict
依照已经train好的model,再加上给定的输入(新值),输出pr
您可能关注的文档
- G3 提车检查表 相当详细 大家可以借鉴 比亚迪.doc
- GB16889-1997生活垃圾填埋污染控制标准.doc
- GE 系列90 30 PLC在散货港口装卸自动化 h.doc
- Germanic Languages日耳曼语系.doc
- get 过去分词 透析 转.doc
- gcc编译流程及编译选项分析.doc
- Ghost是硬盘克隆程序.doc
- GIS、封闭母线、电气二次设备、桥机等设备采购.doc
- GIS发展趋势与方向 地理信息系统.doc
- GMP知识竞赛题库(含答案).doc
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)