支持向量机libsvmpython三分类问题实例介绍.pptxVIP

支持向量机libsvmpython三分类问题实例介绍.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Libsvm+python的使用实例 四百击 目录 1:准备工作 2:EXCEL下的数据处理 3:RBF核函数参数寻优 4:模型训练 5:预测 1:准备工作 到官网上把libsvm,python2.7,gnuplot分别下载下来 如果你的python是64位的,也就是说打开IDLE(python GUI),输入 import sys sys.version 我的电脑(64位系统)上出现如下字符: 2.7.9 |Anaconda 2.2.0 (64-bit)| (default, Dec 18 2014, 16:57:52) [MSC v.1500 64 bit (AMD64)]‘ 这时你需要首先自己编译64位的动态链接库libsvm.dll。方法如下 找到Visual Studio x64 Win64 Command Prompt(2010): 先打开开始菜单,找到VS2013-VS2013 STDIO TOOLS,该程序就在里面 本人电脑里面“VS2013 x64 本机工具命令提示”(Visual Studio x64 Win64 Command Prompt(2010))所在的位置是 C:\Program Files (x86)\Microsoft Visual Studio 12.0\Common7\Tools\Shortc 打开VS2013 x64 本机工具命令提示 把工作目录cd到LIBSVM所在文件夹libsvm-3.16(输入cd+空格+libsvm的位置 输入nmake -f Makefile.win clean all 这时libsvm-3.16的windows目录下将生成64位的动态链接库。将新生成的libsvm.dll复制到系统目录(例如`C:\WINDOWS\system32\)即可 这时候就可以在python下使用libsvm了 2:EXCEL下的数据处理 Libsvm所需的数据格式应该是 lable_value index1:value1 index2:value2.....。 (lable_value,index,value变量的值全部为数值型,lable_value表示样本的类型,在二分类其中,其值一般取-1和1或者0和1,当然取其他值也是可以的,只要能区分就行。index可以理解为遥感影像中的波段序列或者特征序列。value可以理解为对应的像元值或者特征值)。 也就是类似于 1 1:0.302000 2:0.67200 2 1:0.568000 2:0.668000 3 1:0.568000 2:0.668000 这样的,如果你的数据不是这样,请下载FormatDataLibsvmaa.xlsm这个自带宏命令的表格来转换,其中标签向量根据分类的类别自己定义 3:RBF核函数参数寻优 接下来用到位于C:\libsvm-3.21\tools里面的几个小工具 1)把你的数据用checkdata.py来验证下格式是否正确 调用方法:打开DOS,把目录CD到C:\libsvm-3.21\tools 然后输入python checkdata.py datafile (具体调用格式查看README)如没有错误显示如下 2)可以调用SVM-SCALE.py把数值转换为固定区间内的数值(不过我做的时候没有用到) 3)用subset.py 把你的TRAIN数据分为两部分, 比如我把总的240个数据分为了file3和file4,file1有180个(留出60个file2来做train模型的验证),成功之后目录下会多出两个文件file3,file4 4)最重要的是GRID.py 设置好各项参数进行参数寻优(预设值就是RBF核函数) 具体数值区间我是采用的默认值 根据README里面的用法,同时调用GNUPLOT和SVMTRAIN两个地址,可以得出.out和.png两个结果 最后可以得出一个最好的G C两个参数的数值 4:模型训练 在C:\libsvm-3.21\windows下调用SVM-TRAIN,输入优化后的参数,格式如下 其中得出的数据含义 请自己百度。。 5:预测 在C:\libsvm-3.21\windows下调用SVM-PREDICT,按照用法输入,可以得出 输出的最后结果储存在OUT222这个文件中。 注意,正确率为零是因为在TESTD文件中所有数据标签为均4,而train数据的三个标签为1,2,3,肯定都是对不上的(在SVM-PREDICT中你需要分类的数据必须给出任意一个标签数据)。

文档评论(0)

***** + 关注
实名认证
文档贡献者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档