大数据存储与处理-Web-广告.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据存储与处理-Web-广告

大数据存储与应用 Web广告 课程主页:/?page_id=397 陈一帅 chenyishuai@ 内容 背景 算法 匹配 Adwords问题 实现 背景 背景 分类的分类 直投式广告 显示式广告 广告的分类 广告信息平台(直投) 51同城,赶集网,安居客 媒体网站广告(显示) Banner,Impression 同一个用户第二次访问,显示的广告就会不同 站内推荐 还买了什么 Adwords广告 搜索引擎广告 本章重点 广告信息平台 51同城,赶集网 二手,租房,。。。 用户搜索,返回广告 广告和用户搜索的匹配 基于feature,类似搜索引擎 问题:如何排序? 没有PageRank Most-recent first? 可能会被作假。稍微改动一点。用LSH解决 根据点击历史,找出最有吸引力的Item 挺难的。 显示式广告 新闻/媒体网站上的广告 按Impression付费 CPM:Cost per thousand impressions 和电视/杂志广告类似 问题 读者和广告的匹配 每次观看,只值几分钱 改进 网站内容专门化,提高广告和读者的匹配程度。 汽车网上,放汽车广告,价格就提上来了。 显示式广告的优化 根据用户历史,分析用户兴趣,提高广告的针对性 怎么获取用户历史数据? 用户登录 Gmail 微信 Cookie 淘宝 浏览器 360 网络爬虫 搜索广告的问题 按点击付费 Overture发明,付费排名(百度) google Adwords改进(搜索结果和广告分开) 模式: 广告主Bid搜索关键字 搜“癌症”,过来一次访问多少钱 用户Search queries,提供广告 广告主预算(Budget) 每个月200元 问题 如何展示广告,把广告主的预算花光。 例 算法 算法 Off-line算法 完全知道输入,计算最优策略 On-line算法 执行算法时,不知道所有的输入 类似Stream 例: 找伴侣 买滑板还是租滑板? Adwords是一个On-line问题 来一个query,要决定怎么给它显示广告 后面来什么query,不知道 Online算法性能评估 相对于Offline的性能折扣 竞争率 Competitive Ratio (CR) 最差情况下的性能折扣 再差,不会比这差 配对 找朋友 配对模型 bipartite graphs 已知可能配对 无向图 不同于单相思 完美配对(Offline) 每个节点都在另一边找到对象 配对数:4 最大配对 在可能的情况下, 最大配对数 Online Greedy配对 男生Greedy 1 - a 2 - b 3 - d 3对 小伙 姑娘 Online Greedy配对 女生Greedy a - 1 b - 3 2对 小伙 姑娘 为什么这么差? 1)a,b先选。 2)她们有两个可选对象 3)可她们选择的,却是另外的姑娘唯一看上的 Online Greedy配对 女生Greedy a - 1 b - 3 还有比这更差的吗? 如果没有,CR = 1/2 小伙 姑娘 证明CR = ½ G: girls in Mopt but not in Mgreedy |Mopt| = |Mgreedy| + |G| B: Boys who G likes B肯定已被占了 B在Mgreedy里 |B| = |Mgreedy| G in Mopt G中Girl,有一个或多个Boy和她情投意合 |B| = |G| |Mopt|=|Mgreedy| + |G| = |Mgreedy| + |B| = 2|Mgreedy| |Mgreedy| = 2|Mopt| CR = 1/2 广告 一个更复杂的配对问题 问题描述 问题: 依据关键字,选择广告主 在线算法 复杂: 广告主出价不同: 爱的程度不同 广告主有预算(Budget):每个月200元 一个关键字,可以选多个 排序影响点击率 点了,才能挣钱 目标 花光广告主预算 广告主 关键字 Bid 难题1: CTR 收入 = Bid × Click Through Rate (CTR),按收入排序 问题: 如何预测CTR? CTR和算法的互相影响:给它的排序有关 CTR预测 机器学习问题 新Bid 冷启动 老Bid 测量,预测 调整 简化分析 一个query,显示1个广告 广告主Budget相同:B 广告主出价相同:1 CTR相同 类似我们前面分析过的什么问题? 最坏情况 Bid/Budget: 广告主A:沙发:1元 广告主B:沙发:1元;凳子:1元 预算都是2元 查询: 先来2个沙发,再来2个凳子。 Greedy Online算法: “沙发”全给B,赚2元,把B的预算花光 “凳子”来时,B已经没

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档