- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网广告综述之点击率系统.doc
互联网广告综述之点击率系统
声明:
1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献
2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。
3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。
4)阅读本文需要互联网广告业的基础(如果没有也没关系了,没有就看看,当做跟同学们吹牛的本钱)。
5)此属于第一版本,若有错误,还需继续修正与增删。还望大家多多指点。请直接回帖,本人来想办法处理。
6)本人手上有word版的和pdf版的,有必要的话可以上传到csdn供各位下载
一.互联网广告技术
博文《互联网广告综述之生态圈》论述过互联网广告生态圈的各个平台,大家可以看到,其中的Ad exchange是躺着赚钱的平台,风险并不大。
其中的DSP就承担了比较多的风险,如果向Ad exchange请求的流量太贵,而广告主开价比较低的话,就可能面临亏钱。另外,广告主的需求是变化多样的,有些广告主愿意开一定价钱要求多少次点击,而有些广告主就希望开多少价钱有多少次互动,同时广告主会对效果有所需求。换句话说,评估流量的质量对DSP非常重要。
DSP需要评估流量质量,如果发现一个流量的质量很高,就开高价去竟争这个流量;如果流量质量低,就开低价去竟争。如果评估得太高,出很高的价钱拿到了质量很低的流量,那就达不到广告主的要求,会亏钱;如果评估得太低,一直拿不到流量,没办法赚钱。
所谓评估流量质量,说到底了是预估一个流量的ctr(点击率,也成为点击某广告的可能性),所以对于DSP来说,能否估准ctr是DSP生存的关键。
1.1互联网广告点击率预估
做点击率预估需要两方面的数据,一方面是广告的数据,另一方面是用户的数据,对于DSP来说,广告数据它自己有,用户数据可以从DMP获取,它自己的工作是利用这两方面的数据评估用户点击这个广告的可能性(也就是概率)。
1.1.1 预估方法讨论
对点击率的预估,做的工作可以用下面的图来描述。
预估一个人点击一个广告的概率,不可能是一个人在那里看着,来一个广告请求就估计一下,给个决定,这样人累死,估计得也乱七八糟,还效率不高,一天撑死了估计个几十万个请求,不得了了。
只能用机器来估,但是机器是很笨的,只能进行简单的规则运算,这些规则还必须提前指定。如果人工指定这些规则,如30岁用户点击匹克篮球的广告概率是多少,男性的用户点击匹克篮球的广告的概率是多少,年龄和性别在总的ctr预估里面占多少比重等等,则需要大量的先验知识,而且还不能根据实际情况变化,往往有问题。
这就需要机器学习方法来辅助了,一个是统计方法,一个是模型。
统计方法怎么用呢?如可以统计过去投放过的记录中,30岁的用户点击匹克篮球的广告的点击率是多少,这个数据直接就能根据投放日志统计出来;再统计男性的用户点击匹克篮球的广告的点击率是多少,这样前面的两个东西就得到了。
但是知道这两个点击率,还需要知道这两个点击率在评估这个人点击匹克篮球的广告的概率中分别起什么作用。这两个点击率加起来不行,相减也是不行的,加权累加可能是一种办法,但是这样行吗?为了解决这个事情,需要用模型来解决了。为了描述的方便,我们把这两个点击率称为特征,用一个向量x=(x1,x2)来统一表示,其中x1表示30岁的用户对匹克篮球的广告的点击率,x2男性的用户对匹克篮球的广告的点击率。
利用模型做ctr预估,用数学的方法来描述就是完成上面的图中函数f的形式。
本来这个函数的形式是很复杂的,但是太复杂的模型不利于扩展,就用简单的形式来。经过工业界长期的工作,认为下面的形式是比较有效的。
其中x是上面的那个x,w也是一个向量,表示的是x的每个特征的权重。这个w每取一个值,对相同的user和ad对就能得到一个预估的ctr,w同时也被称为是模型,因为它能根据x的取值,也就是特征的取值来决定ctr。
权重可以人工指定的,但是上面说过了,需要大量的先验知识,而且特征会特别多,如上面还有地域,职业,学校什么的,可以搞到成千上万的特征,人工指定没办法做到周全。所以这个权重的是要用算法来让机器自己学习到的,这个过程称为训练,这个训练过程还不能只根据一个记录user和ad对来训练,要根据很多对来训练。每个展示记录就是一个对,根据历史的一段时间内的展示记录,能有很多的的数据对可以进行训练。
用什么方法进行训练呢?上面user和ad对可以达到上亿的量级。
机器学习领域的把这个训练过程称为是拟合分布的过程,他们认为一次广告的展示是否被点击(每次展示被点击的概率可能不一样)是一个伯努利试验,对多
您可能关注的文档
- 提升银行资本管治效率的路径-银行业.doc
- 精品工艺工法(房地产篇)安装部分解读.doc
- 华鑫物流有限公司仓储管理信息系统设计方案.doc
- 人事档案管理系统开题报告.doc
- 制造现场精细化管理 2477字 投稿:毛廟廠.doc
- 2017重庆教育系统网络安全知识竞赛题库(中学组).doc
- 书店辅助进书系统—免费毕业设计论文.doc
- 依法行政行政法基本原则.doc
- 依法行政工作总结模板4篇-依法行政工作总结模板4篇-依法行政工作总结模板4篇-.doc
- 增值税视同销售货物行为会计处理探析_论文.docx
- 河北省唐县2022-2023学年高一(下)期中物理试卷(含答案).pdf
- 江苏省南京市六合区2022-2023学年三年级下学期数学期中试卷(含答案).pdf
- 河南省焦作市2022-2023学年高一下学期物理期中试卷(含答案).docx
- 北京市顺义区2022-2023学年高一下学期期中物理试题(含答案).docx
- 湖北省孝感市汉川市2022-2023学年三年级下学期数学期中试卷(含答案).docx
- 吉林省白城市通榆县第一大学区2022-2023学年三年级下学期数学期中教学质量教研评估(含答案).docx
- 向政府申请帮助报告范文.docx
- 现场审计工作报告范文.docx
- 项目材料报告范文.docx
- 项目监察报告范文.docx
文档评论(0)