lecture20crawling 信息检索导论 王斌 PPT 课件 第20章概要1
第20讲 信息采集
Crawling
1
2011/12/01
提纲
2
上一讲回顾
一个简单的采集器
一个真实的采集器
提纲
3
上一讲回顾
一个简单的采集器
一个真实的采集器
4
搜索广告
4
5
Google次高竞标价格拍卖机制
bid: 每个广告商为每次点击给出的最大投标价格
CTR: 点击率,即一旦被显示后被点击的比率。CTR是一种相关性度量指标。
ad rank: bid × CTR: 这种做法可以在 (i) 广告商愿意支付的价钱 (ii) 广告的相关度高低 之间进行平衡。
rank: 拍卖中的排名
paid: 广告商的次高竞标价格
5
6
Google次高竞标价格拍卖机制
次高竞标价格拍卖: 广告商支付其维持在拍卖中排名所必须的价钱(加上一分钱) (用它的下一名计算其支付价格)
price1 × CTR1 = bid2 × CTR2 (使得排名rank1=rank2)
price1 = bid2 × CTR2 / CTR1
p1 = bid2 × CTR2/CTR1 = 3.00 × 0.03/0.06 = 1.50
p2 = bid3 × CTR3/CTR2 = 1.00 × 0.08/0.03 = 2.67
p3 = bid4 × CTR4/CTR3 = 4.00 × 0.01/0.08 = 0.50
6
7
置换和最小值:例子
文档 1: {
原创力文档

文档评论(0)