网站大量收购独家精品文档,联系QQ:2885784924

144-数据科学家必备套路之三:广告套路【萌萌家】.pdf

144-数据科学家必备套路之三:广告套路【萌萌家】.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

144|数据科学家必备套路之三:广告套路

2018-07-18洪亮劼来自北京

《AI技术内参》

讲完了搜索产品和推荐系统的套路,今天我们继续来看数据科学家应该掌握的广告产品的一些

套路。

利用搜索和推荐的套路

前面我们讲过两种普遍使用的互联网广告模式,搜索广告和展示广告。对于搜索广告而言,一

个基本套路就是尽量利用现有的搜索系统来推送广告。而对于展示广告而言,一个基本套路就

是尽量利用现有的推荐系统来推送广告。

我们在介绍推荐套路时提过,推荐系统和搜索系统的很多方面其实都有重叠,所以做好一套搜

索系统是非常有必要的,几乎所有的广告应用其实最终也可以在搜索系统的架构上搭建。因

此,我们可以说,搜索系统是很多现代人工智能系统应用的一个核心技术组件。

具体来说,广告其实也和一般的文档一样,首先利用搜索引擎的索引把这些广告都存储起来。

对于搜索广告来说,利用关键词的倒排索引,可以轻松地找到相关的广告,这和找到相关文档

的原理其实是一样的。

当然,我们前面也提到过,广告的排序和普通文档有一个不一样的地方,那就是竞价。因此,

在从索引中提取广告的时候,我们必须要去思考一个问题,如何让广告竞价的赢家能够从索引

中被提取出来?

我们知道,广告的竞价常常是以点击率和出价的乘积来作为排序的依据。这就会有一个问题,

如果我们从索引中提取广告的时候,仅仅看哪些广告从关键词的角度是相关的,而忽略了点击

率和出价,那么,最后提取出来的广告很有可能不是真正能够赢得竞价的广告。

如何来对这个问题进行修正呢?一种做法是在索引里面增加点击率信息。也就是针对每一个关

键词,我们不是按照文本的相关度去索引最相关的文档,而是按照点击率去索引点击率最高的

一系列文档。

那么,当需要针对某一个关键词提取广告的时候,我们就直接从这个关键词所对应的索引中提

取点击率最高的几个广告。这个时候,我们再从某一个存储出价的数据库中读取这些广告的出

价,并且进行竞价排序。

从这个流程我们可以看出,最终的竞价排名很可能并不是完全依赖点击率和出价的乘积,而是

在点击率先有了一定的保证下的这个乘积的排序。这种有保障的点击率常常被叫做“质量值”

(QualityScore),用来描述这些广告的点击率高于一个设定的阈值。

接下来,我们来看广告提取的另外一个重要的要求,就是需要满足广告投放的业务逻辑。比

如,有一个广告的投放要求是针对男性,现在有一个女性用户,那么,我们就不应该针对这个

用户显示这个广告,而不管这个广告的点击率和出价信息是怎样的。

如何实现这样的效果呢?我们依然可以利用索引。在索引中,我们插入广告的各种投放条件作

为被索引的对象,然后把在这个投放条件下的各种广告作为文本。这样,我们就可以提取满足

任意投放条件的广告了。

针对这些投放条件的组合,例如投放条件是“女性、在北京”,我们可以认为是在索引上进行

“且”操作,也就是提取出同时满足两个关键词的操作。事实上,针对任意一个关键词的广

告,我们都是进行了多个“且”操作。例如,针对“可乐”这个关键词,我们可能是需要提取

这个关键词点击率最高的100个广告(如果有那么多的话),并且这些广告的投放条件都满

足“女性、在北京”。当提取出了这些广告之后再进行竞价排名。

当然,在这样的架构下,我们就需要对索引有快速更新的能力,例如某一个广告的点击率或者

投放条件都有可能发生变化。

层次建模套路

对于广告系统的建模有一个基本的套路,那就是层次建模(HierarchicalModeling)。什么

是层次建模呢?在广告的生态系统中,至少有广告商、广告推广计划、单一广告这三个层次的

实体。提高广告投放精准度的一个核心问题,就是如何能够对这这三种实体进行有效建模。

当我们对当前的广告商一无所知的时候,需要看一看过去有没有其他类似的广告商在平台投放

过广告,如果有,那么能否借鉴那些过去的数据。当这个广告商开始投放广告以后,我们就可

以积累数据,慢慢就能够增强对这个广告商的建模能力。

类似的,当我们计划推出某一个广告推广计划的时候,我们先看一看同一个广告商有没有类似

的推广计划,或者看一看其他类似的广告商有没有相近的推广计划。当某一个广告开始运行的

时候,我们看一看同一个推广计划下其他广告的表现,或者是同一个广告商下其他广告的表

现。

层次建模的一个重要的特点就是利用可以利用的一切其他信息来进行建模。在计算广告中,经

过验证,层级信息往往是最有用的特性。

具体和泛化的套路

这个套路其实并不是完全针对广告的。就像我们之前所说的广告、搜索和推荐之间的关系,这

个套路其实也可以

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档