源代码机器学习之支持向量算法实现-peaker.pdfVIP

源代码机器学习之支持向量算法实现-peaker.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

#源代码#机器学习之支持向量机算法实现

Peaker

有些人认为支持支持向量机svm是最好的现成的分类器,这里说

的现成是指分类器不加修改即可直接使用。同时,这就意味着在数据

上应用基本形式的svm分类起就可以得到低错误率的结果。smv能够

对训练集之外的数据点做出很好的分类判别。

在这里我们介绍一下svm的基本概念,以及代码实现方法。

在svm中采用的上最大间隔分割数据,他的优点谁泛化错误率

低,计算开销不大,结果容易解释,但是他的缺点上对参数调节和核

函数选择敏感,原始分类器不加修改仅适用于处理二分类问题。svm

适用的数据类型是数值型和标称型数据。

在介绍svm之前我们要先理解一些概念。例如下图所示

在上图的数据点分布中,我们要考虑的问题是如何画出一条直线

将圆形点喝方形点区分开。如图所示,他们已经分的足够开了,因此

很容易通过一条直线将她们区分。在这种数据中我们称之为线性可分

数据。但是仍有一些数据类型无法通过一条直线进行区分和判别,例

如下面四个例子,我们称之为线性不可分数据。

上述数据分隔开的直线称为分割超平面,由于例子中的数据点都

是在二维平面的,所以此时分割超平面就是一条直线。但是如果给出

的数据是三维的,那么此时的分割超平面就是一个真正的平面了。我

们希望可以采用这种方式来构建分类器,即如果数据点离决策边界越

远,那么其最后的预测结果也越可信。在两组数据中间存在无数个几

何超平面,那么哪一个才是最好的呢?我们希望可以找到里分割超平

面最近的点,确定他们离分割面多距离尽可能的远。这里分割面的距

离称为间隔。那么我们的问题就升级为寻找最大间隔。

何求解数据集的最佳分割直线?来的例子

分割超平面的形式可以写成wTx+b.要计算a点到分割超平面的

距离,就必须给出分割面的法线或垂线的长度,该值为|wTx+b|/

||w||。这里向量w和b描述了所给数据点分割线或超平面。

在svm分类器中实现寻找分割超平面的原理类似于logistic逻辑

回归,代码如下

通过识别分割超平面,我们就可以进行简单的二分类问题,调用

svm的代码如下

但是到目前为止我们也只是实现了构建svm分类器,通过训练样

本计算分割超平面,然后对测试样本进行预测,这一原始的简单分类

器目前还只能在二分类问题上进行实现,如果想处理更高级更复杂的

问题,或者要提高精度,那么更进一步多优化则是必要的。

喜欢本文吗?欢迎加入云生信跟大家一起进步~

文档评论(0)

kay5620 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8001056127000014

1亿VIP精品文档

相关文档