- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据存储与处理-Web-广告
大数据存储与应用Web广告
课程主页:/?page_id=397
陈一帅
chenyishuai@
内容
背景
算法
匹配
Adwords问题
实现
背景
背景
分类的分类
直投式广告
显示式广告
广告的分类
广告信息平台(直投)
51同城,赶集网,安居客
媒体网站广告(显示)
Banner,Impression
同一个用户第二次访问,显示的广告就会不同
站内推荐
还买了什么
Adwords广告
搜索引擎广告
本章重点
广告信息平台
51同城,赶集网
二手,租房,。。。
用户搜索,返回广告
广告和用户搜索的匹配
基于feature,类似搜索引擎
问题:如何排序?
没有PageRank
Most-recent first?
可能会被作假。稍微改动一点。用LSH解决
根据点击历史,找出最有吸引力的Item
挺难的。
显示式广告
新闻/媒体网站上的广告
按Impression付费
CPM:Cost per thousand
impressions
和电视/杂志广告类似
问题
读者和广告的匹配
每次观看,只值几分钱
改进
网站内容专门化,提高广告和读者的匹配程度。
汽车网上,放汽车广告,价格就提上来了。
显示式广告的优化
根据用户历史,分析用户兴趣,提高广告的针对性
怎么获取用户历史数据?
用户登录
Gmail
微信
Cookie
淘宝
浏览器
360
网络爬虫
搜索广告的问题
按点击付费
Overture发明,付费排名(百度)
google Adwords改进(搜索结果和广告分开)
模式:
广告主Bid搜索关键字
搜“癌症”,过来一次访问多少钱
用户Search queries,提供广告
广告主预算(Budget)
每个月200元
问题
如何展示广告,把广告主的预算花光。
例
算法
算法
Off-line算法
完全知道输入,计算最优策略
On-line算法
执行算法时,不知道所有的输入
类似Stream
例:
找伴侣
买滑板还是租滑板?
Adwords是一个On-line问题
来一个query,要决定怎么给它显示广告
后面来什么query,不知道
Online算法性能评估
相对于Offline的性能折扣
竞争率
Competitive Ratio (CR)
最差情况下的性能折扣
再差,不会比这差
配对
找朋友
配对模型
bipartite graphs
已知可能配对
无向图
不同于单相思
完美配对(Offline)
每个节点都在另一边找到对象
配对数:4
最大配对
在可能的情况下,
最大配对数
Online Greedy配对
男生Greedy
1 - a
2 - b
3 - d
3对
小伙
姑娘
Online Greedy配对
女生Greedy
a - 1
b - 3
2对
小伙
姑娘
为什么这么差?
1)a,b先选。
2)她们有两个可选对象
3)可她们选择的,却是另外的姑娘唯一看上的
Online Greedy配对
女生Greedy
a - 1
b - 3
还有比这更差的吗?
如果没有,CR = 1/2
小伙
姑娘
证明CR = ½
G: girls in Mopt but not in Mgreedy
|Mopt| = |Mgreedy| + |G|
B: Boys who G likes
B肯定已被占了
B在Mgreedy里
|B| = |Mgreedy|
G in Mopt
G中Girl,有一个或多个Boy和她情投意合
|B| = |G|
|Mopt|=|Mgreedy| + |G| = |Mgreedy| + |B| = 2|Mgreedy|
|Mgreedy| = 2|Mopt|
CR = 1/2
广告
一个更复杂的配对问题
问题描述
问题: 依据关键字,选择广告主
在线算法
复杂:
广告主出价不同: 爱的程度不同
广告主有预算(Budget):每个月200元
一个关键字,可以选多个
排序影响点击率
点了,才能挣钱
目标
花光广告主预算
广告主
关键字
Bid
难题1: CTR
收入 = Bid × Click Through Rate (CTR),按收入排序
问题:
如何预测CTR?
CTR和算法的互相影响:给它的排序有关
CTR预测
机器学习问题
新Bid
冷启动
老Bid
测量,预测
调整
简化分析
一个query,显示1个广告
广告主Budget相同:B
广告主出价相同:1
CTR相同
类似我们前面分析过的什么问题?
最坏情况
Bid/Budget:
广告主A:沙发:1元
广告主B:沙发:1元;凳子:1元
预算都是2元
查询:
先来2个沙发,再来2个凳子。
Greedy Online算法:
“沙发”全给B,赚2元,把B的预算花光
“凳子”来时,B已经没
您可能关注的文档
最近下载
- 2025《水下清淤机器人的结构方案设计》13000字(论文).docx
- [硕士]宣钢近北庄铁矿滑坡机理及稳定性分析.pdf VIP
- 2025年“三新”协同教研共同体高一联考英语试卷及答案.docx VIP
- 中国海洋(大学)高等代数历年考研试题.pdf VIP
- 856高等代数之中国海洋(大学)(2018至2021)考研真题.pdf VIP
- 2020-2021学年安徽省合肥市长丰县杨公镇朱集中学高一数学理下学期期末试卷含解析.docx VIP
- PLC西门子S7-200温度控制系统毕业设计-使用教程.pdf VIP
- 新22S3 室外排水工程建筑工程图集.docx VIP
- 江苏省姜氏宗亲分布村落.docx
- 2025年北京理工大学计算机科学与技术专业《操作系统》科目期末试卷及答案.docx VIP
原创力文档


文档评论(0)