- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
每天点击数100以内的微小量渠道,如何精准地投放玩耍广告?
1.1 ? ?为什么要有精准投放算法 - 先知
随着公司玩耍业务的进展,传统的搜索技术已经不能满足用户对玩耍发觉的需求,缘由有多种,首先用户很难用合适的关键词来描述想要玩的玩耍,其次用户的爱好和喜好在不断变化和更新,再者用户无法对本人未知而又可能感爱好的玩耍做出描述。推举系统的消灭可以帮用户猎取更丰富,更符合个人爱好的玩耍。
在流量格外紧缺的互联网上,用户直面的并不是玩耍本身,而是一条条广告素材,广告素材是经过美术定制加工在广告投放时播放的视频,Flash 或者呈现的图片等。共性化推举会依据用户爱好和行为特点,向用户推举所需的玩耍素材,挂念用户在海量信息中快速发觉真正所需的玩耍,提高用户黏性,促进素材背后玩耍的注册和收入。
在广告市场,以参与者划分可以分成平台方和买量方,与诸如淘宝直通车,腾讯广点通,微博粉丝通这类平台上广告系统不同,买量方做广告效果的优化存在以下特点:
(1)渠道流量小,特殊渠道流量微小。公司的买量渠道品种众多,投放渠道近百个,流量大小不一,统计每天点击数在 100 以内的渠道广告方案量占比 65%。数据集的稀疏度应当在十万分之一或以下的量级,特征中有效信息(非 0 值)的维度很低,其中包含的噪声会对真实信息干扰很大.使得绝大部分基于关联分析的算法(譬如协同过滤)以及 CTR 预估效果都不好。这个问题本质上是无法完全克服的。因而对于这些微小量渠道的玩耍广告精准投放算法需求格外迫切。
(2)买量方对于用户爱好和行为特点的信息了解甚少,虽然与部分平台的合作能够拿到肯定维度的属性数据,但是总体上大部分长尾渠道信息是格外少的,这样形成了用户属性的缺失,并且点击广告的很多均为新用户,考虑到冷启动问题。标签系统供应了处理冷启动问题的可能方案。由于标签既可以看作是素材内容的萃取,同时也反映了用户的共性化喜好。
综合以上实际情况的考虑:用于处理微小量渠道的,基于标签的精准投放算法 - 先知应运而生。
2 算法原理
2.1 ? ?算法概述
推举系统的目的是联系用户的爱好和素材,这种联系方式需要依靠不同的媒介。目前流行的推举系统基本上是通过三种方式联系用户爱好和物品:
图 2-1 推举系统联系用户和素材的几种途径
考虑到数据稀疏性,协同过滤方式效果不好。因而考虑第三种方式:通过一些特征联系用户和素材,给用户推举那些具有用户宠爱的特征的素材,这里的特征有不同的表现方式,比如可以表现为物品的属性集合,也可以表现为隐语义向量,而下面我们要争辩的是一种重要的特征表现方式——标签。
2.2 ? ?什么是素材标签
在美术做完一个素材后,会给素材打上对应标签,标签内容如下:
图 2-2 素材人工标签
经过标签层级处理,并且标签变量 0-1 处理后得到每个素材的标签:
进行哑变量处理得到素材标签矩阵 T:
表2-1 哑变量处理后的素材标签矩阵
素材ID
标签1
标签2
标签3
标签4
标签5
…
标签n
ad_1
1
1
1
0
0
…
…
ad_2
1
0
0
1
1
…
…
ad_3
0
1
1
0
1
…
…
2.3 ? ?什么是用户标签
在用户恳求广告数据时,我们可以通过恳求时间以及用户 Cookie 得到用户属性数据,经过正则化解析后得到用户属性矩阵 A:
表2-2 用户标签矩阵
用户ID
时间
地区
扫瞄器
操作系统
关键词
user_1
1
1
1
0
0
user_2
1
0
0
1
1
user_3
0
1
1
0
1
2.4 ? ?如何生成标签点击率
模型依据历史数据中用户的恳求,素材加载,素材点击等行为动身,最终定位用户的爱好标签,考虑用户属性,时间衰减等因素,计算出每个属性下的标签点击率矩阵 C。流程如下所示:
图 2-3 标签点击率生成流程图
2.5 ? ?如何依据标签点击率进行推举
当一个用户发生广告恳求时,该广告所在的方案有 M[C1,C2,,,Cm] 种素材,依据用户属性 A[time,local,browser,OS,UID],以及 2.3 生成的标签点击率矩阵 C,得到 M 个素材的推举值:
对该方案下 M 个素材的在各个属性的评分进行加权:
对该方案下属性 A 的用户的恳求,推举 M 个素材中 R_m 值最大的那个素材。
2.6 算法全体流程
全体流程图如下:
(1) 离线计算:依据广告恳求 - 点击历史数据,对于每个渠道方案,每隔一小时离线计算每个属性下的标签点击率矩阵 C。
(2) 在线计算:在线引擎需要依据当前恳求用户属性 A,去读取相应特征数据,进行计算得到每个素材推举值矩阵 R_m。
(3) 广告投放引擎:广告投放引擎前往 R_m 排序后的最佳素材给 web 服务器,最终显示给用户。
图 2-4 算法全体流程
3 算法优化
3.1 ? ?
您可能关注的文档
最近下载
- 2025年酒店筹建提供顾问服务合同.pdf VIP
- 高考语文古代诗歌阅读分类训练:哲理类(含解析).docx VIP
- 天津市2023-2024学年高二上学期物理期中考试试卷(含答案).pdf VIP
- 智茂GAM330 GAM320编程基本操作.ppt VIP
- HGT3737-2018 厌氧胶粘剂行业标准.pdf VIP
- 《2025年四川省事业单位招聘考试综合类公共基础知识真题试卷》真题题库.docx VIP
- 2024-2025学年河南省郑州四中八年级(上)期中数学试卷.pdf VIP
- 雾灵山阿那亚国家级休闲康养旅游度假区总体规划.pptx
- 三查四定设备篇.ppt VIP
- 传统文化的现代设计.pptx
原创力文档


文档评论(0)