多类分类.pdfVIP

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多类分类

多类分类 9.520 :第21 课 Ryan Rifkin “一个故事 由愚人讲述,会充满着大吵大闹, 其实什么也没有。” Macbeth , Act V ,Scene V 什么是多类分类? 每一个训练点属于 N 个不同的类中的一个。目标是构造一个函数,对于给定的一个新的数据点, 该函数能够正确预测它所属的类别。 什么不是多类分类? 在许多情形中,存在数据点所属的多个类别,但是一个给定的点可以属于多个类别。在这种情 形的最基本的形式中,该问题可以简单的分解为一组无联系的二元问题,从而可以通过使用我 们对于二元问题的方法,很自然的得到解决。 第一个想法 假定对于 N 个类别中的每一个,我们都知道它的密度p (x ) 。那么,我们可以通过使用 i 来预测。 当然我们不知道密度,但是我们可以使用经典的方法来估计它们。 密度的问题,以及动机 估计密度是困难的,尤其是当维数很高,数据有限时。 对于二元分类任务,我们已经看到了与密度估计相比,直接估计一个光滑分离函数能够给出更 好的结果(SVM,RLSC )。那么我们能将这些方法有效的推广到多类的情形吗? 一个简单的想法——一对全部的分类 选取一个好的方法用于建立二元分类器(如 RLSC ,SVM )。建立N 个不同的二元分类器。对于 第 i 个分类器,将类别 i 中的点作为正样本,将不在类别i 中的所有其他点作为负样本。设f i 是 第 i 个分类器。使用 来分类一个新的函数。 事实 就我所知道的,选择一个适当调整好的正则化分类器(如 RLSC ,SVM )作为你的基本二元分 类器并且使用一对全部的方法(OVA )就已经是最好的了。 如果你实际上必须解决一个多类问题,我强烈地建议你单单使用 OVA 就可以了,不用考虑别的。 其他的方法 有两个基本的方法将正则化的思想推广到了多类分类问题: “单机”方法——尝试去解一个单最优化问题,该问题是同时训练许多二元分类器。 “错误纠正码”方法——尝试以一种让你可以研究去相关并且修正错误的方式来组合二元 分类器。 这些方法并不是完全互斥的。 Weston 和 Watkins ,Vapnik 第一个“单机器”方法: s.t.: 关键的思想,假设点 i 在类别y 中。那么,对于j ≠y ,我们希望有 (滥用了我们的符号w.r.t.b ), i i 或者我们给一个线性惩罚ξij 。 WW 分析 I 这个想法直观上看起来是合理的。它是一个好的想法吗? Weston 和 Watkins 做了实验。在 5 个数据库当中的 2 个数据库上,他们发现他们所使用的方法 要显著的优于 OVA,并且在其他的数据库上也有同样结果。然而,他们声称“为了能够比较, 对于每一个算法,取 C ∞ (训练数据必须在没有错误的情况下被分类)”,因此他们运用ERM 而非正则化( C =∞⇔λ 0 )。他们使用了一个对每一方法都有相同σ 的高斯核(这并不一 定是一个好的想法),并且没有关于该σ 如何被选取的信息。 WW 分析 Ⅱ 在什么情况下我们希望该方法会优于 OVA 方法?这不太好回答。我们需要一个实际上很难将数 据分离开的情形,但在这种情形中存在一些有意义的数据子集,在这些子集中即使我们不能够 对正确的类别赋一个正数值,我们也能够给它赋一个比其他类别都小的负数值。或者,我们需

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档