机器学习基础_深圳光环大数据人工智能培训.pdf

机器学习基础_深圳光环大数据人工智能培训.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器学习基础_深圳光环大数据人工智能培训

光环大数据--大数据培训&人工智能培训 机器学习基础_深圳光环大数据人工智能培训 本次分享主要分为以下四个部分:1.ML 技术都用在哪里?2.最常用的LR 是 什么鬼?3.ML 工程师每天都在干什么?4.DL 在企业里都怎么玩?一、ML 技术都 用在哪里?以一次搜索引擎检索为例,在搜索框中输入关键词“承德旅游”。可 以发现,在搜索结果中既有自然搜索的结果也有sponsored search 的广告结果。 在这样一次检索的背后发生了什么呢? 下图是一个检索的示意图。最前端是WEB 服务的网关,比如Nginx,Tengine 这样的服务器。输入的查询词是“承德旅游”。 首先,它会进入高级检索模块,其中包含很多步骤,比如query 分析、query 变 换、query 规约、关键词扩展等。找到了query 召回信号之后,进入基础检索进 行召回,比如广告主文案的召回。下图最下部分是检索索引部分。众所周知,在 sponsored search 中,广告的排序是和广告在展示后是否会被用户点击是直接 相关的。但决定广告在一个队列里时的先后顺序时,就需要用到机器学习。这是 一个典型的二分类,即点击或不点击。点击率预估模块可以在下图的左侧找到。 类似的机器学习的例子还有很多。比如,打开手机淘宝,在这一块区域中,每一 个人看到的结果都不一样。右边是手机淘宝的首页下方的猜你喜欢商品推荐模块。 这个模块会根据用户的长短期兴趣来推荐不同的商品。像这样的商品推荐应用中 就大量地使用了机器学习相关的技术。 类似的系统有很多,比如 Netflix,它 曾是美国的一个租碟公司,现在主营网络视频和电视直播等等。下图是它的系统 架构图。其中既有搜索也有推荐,大量的使用了机器学习的相关技术。下图是一 个简要的淘宝推荐示意图。可以从用户的行为日志中挖掘可能的商品和商品之间 的关联,以及用户的喜好。在做出一些推荐之后,会对推荐进行排序、过滤等。 这其中,商品展示后是否会被用户点击,用户点击后是否会购买,都是典型的二 分类问题,都可以转化为机器学习问题来处理。在做机器学习相关的应用时,只 要我们识别出这些问题可以利用机器学习的相关技术去解决,那就可以使用相关 的模型或算法去解决相应的问题。现在常用的机器学习中,统计机器学习的应用 是比较广的。它有三个要素,首先是模型,即决策函数。第二,学习策略,即损 光环大数据 光环大数据--大数据培训&人工智能培训 失和风险是什么。第三,算法,就是要把模型中相应的权重求出来。下图右侧列 了一些比较典型的问题,比如网页的主题聚类,查询词的意图识别、多个衡量网 页与查询词相似度方法的结果的融合,包括经典的点击率预估和商品转化率的预 估。这些问题都可以作为机器学习问题来做。在现代后端商业系统中,一旦碰到 分类类的机器学习,很多公司都会选择logistic 回归,为什么大家都会选择LR 呢?在企业级应用中有一些原则。 数据的丰富性比模型的选择更重要。数据干净,数据量大、数据的质量 高时,用一些简单高效的模型就可以取得非常好的效果。 模型的吞吐能力。在企业级应用的时候,一般都会面临海量数据,模型 求解对数据的吞吐能力就是大家关注的一个重点。 求解算法的并行化难度的高低。如果并行度很低,在大规模海量数据处 理的时候,就很难运用集群的力量来达到加速的目的。 模型的迭代速度 特征的自解释性及 badcase 控制。Logistic 回归在特征的自解释性上 的表现很好,比如现在常用的深度学习,网络模型重权重与其物理含义之间有比 较清晰的对应关系。相应的,如果在一些样本上学偏了或者是碰到了一些badcase, 像logistic 回归这样,天然具有自解释性的模型就能很好地控制这些情况。 二、最常用的LR 是什么鬼?接下来给大家解释一下logistic 回归的原理。 Logistic 回归是广义线性回归中的一种。线性回归,如下图第一个公式所示, 大家很容易理解。Logistic 回归在线性回归的基础上进行了 logit 变换。如下 图第二个公式所示。可以发现,当概率趋近于零时,权重就会发生剧烈的震荡。 为了让求解的概率结果具有从0 到1 的物理含义,同时也避免一些震荡,因此进

文档评论(0)

明若晓溪 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档