机器学习-PLA算法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最近在跟台大的这个课程,觉得不错,想把学习笔记发出来跟大家分享下,有错误希望大家指正。 一机器学习是什么? INCLUDEPICTURE \d /blog/115277/201312f53fbb7d9a2d4cfba556586png \* MERGEFORMATINET  ? 感觉和?Tom M. Mitchell的定义几乎一致, A computer program is said to learn from?experience?E with respect to some class of tasks T and performance measure?P, if its performance at tasks in T, as measured by P, improves with experience E. 简而言之,就是我们想要机器在某些方面有提高(如搜索排名的质量,即NDCG提高),就给机器一些数据(用户的点击数据等各种)然后让机器获得某些经验(Learning to rank的一种模型,也就是数学公式)。这里有点需要强调,那就是提高指标,必须要有某种指标可以量化这种提高,这点还是很关键的,工业界做机器学习,首先关注data,其次就是有无成型的measurement,可以使Precision/Recall,也可以是NDCG等。 ? 二什么时候可以用机器学习? INCLUDEPICTURE \d /blog/115277/2013124e575d66c2804817b0601d1f69cf3e04.png \* MERGEFORMATINET  ? 其实就三要素: 有规律可以学习; 编程很难做到; 有能够学习到规律的数据; 编程很难做到可以有多种,大部分原因是系统太复杂,很难用Rule-based的东西去解决,例如搜索排名,现在影响排名的因素有超多几百种,不可能去想出这些因素的规则,因此,这时候用机器学习就是恰到好处。特别是移动互联网的今天,用户更容易接触互联网,产生的数据越来越多,那么要找到某些不容易实现的规律,用机器学习就是很好的了,这也是为啥机器学习这么火,其实我学机器学习不仅仅是一种投资(肯定它未来的发展前途),我想做的事情还有一点,就是通过它更深刻的理解人脑的学习过程,提高自己的学习效率和思维能力。 ? 三具体如何用机器学习? INCLUDEPICTURE \d /blog/115277/201312bd9ddd94d34f4bf3a41c6e0d98b4cb04.png \* MERGEFORMATINET  INCLUDEPICTURE \d /blog/115277/20131278260f3fa16a4967b0e398a68b63abbe.png \* MERGEFORMATINET  ? 输入是两个:1 data;2?假设集合。Data如何使用?通过提取出feature vector来使用,也就是那个training examples,假设集合是用来选取最终f的。也就是说,输出就是f(或近似f)。 ? 四第一个机器学习算法:PLA(Perceptron Learning Algorithm) 课程讲述这个算法的总体思路如下(典型的提出问题,分析问题以及解决问题): ? 通过信用卡问题引入PLA; 对问题用数学抽象,并得到目标函数; 详细解释PLA迭代(学习)过程; 证明PLA学习的过程可以收敛并会得到最优解; 分析PLA优缺点,并提出克服缺点的一些方法; ? 这个算法本质上是线性分类器,针对给定的feature vector给出Yes?或者?No的回答 下面是用这个算法去解决信用卡问题的数学抽象: INCLUDEPICTURE \d /blog/115277/201312fe19d9a290b54becad3d736d4ad30863.png \* MERGEFORMATINET  这里的思想在于朴素的把从用户信息抽出来的一些feature(年龄等)量化并组成vector,然后乘以一个权重向量,并设定一个阈值,大于这个阈值就表示好,小于表示不好,很明显这个式子的未知变量有两个(实际只有一个): 权重向量?wi, 1=i=d; 阈值,下面设为0 做一点小小的变形使得式子更加紧凑, INCLUDEPICTURE \d /blog/115277/201312f32ad04c6010480384e7638781bdc088.png \* MERGEFORMATINET  还有就是从这个模型可以知道,regression model也可

文档评论(0)

wuailuo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档