检索及推荐中的排序.pdfVIP

  • 62
  • 0
  • 约2.17万字
  • 约 18页
  • 2017-06-07 发布于湖北
  • 举报
检索AS 和推荐AS 的排序方法 Jicheng Zhao (zhaojicheng@) 目录 检索AS 和推荐AS 的排序方法1 1. AS –排序(以CTR 为目标的相关性,质量度的综合排序)1 1. Signals/features (Item 基础权重) 6 2. 基于反馈的排序and LTR (Learning to rank)9 3. LTR 中对于Hybrid Models 的考虑13 4. 其它基于产品层面的考虑14 5. LTR 和多目标优化17 Appendix 17 1.AS –排序(以CTR 为目标的相关性,质量度的综合排序) AS 排序中考虑的是CTR 的提升,没有把相关性,质量度等分别考虑。其实在把个性化特征, Item 属性特征都用上之后,也没有必要区分质量度和相关性。 【但CTR 不是我们的最终目标 (比如,sexFactor 高的item 的CTR 都高,但这在很多场景下 不是我们所需要的),如何在AS 排序中给定一个更为合理的优化目标,是一个问题。】 AS-reRank 以RS 触发的item 为基础(也可以利用上RS 的排序和打分),把尽可能多的特征用到一个综 合的CTR 预估模型中,一些体验层面的特征也是可以放进来的,比如: 1. 新颖性:Item 的上线时间: a) 根据用户行为在网站的分布情况,得到 item 的半衰期,从而作为该网站是否对时 间敏感的一个指标,再用到new item 的加权上; b) “Delta_T * Site”作为特征用到CTR 预估模型中 (其中Delta_T 为目前时间和Item 上线时间的差值天数,因为需要不断计算,成本较大); 2. 不同用户的差异 a) 把“用户在目前网站上的行为数×Site ”作为特征用到CTR 预估模型中(其中行为 数做一定的分段处理); 3. 不同规模站点对方法的偏好性 a) 把“站点规模×推荐方法” 作为特征用到CTR 预估模型中 4. RS 模型的特征:各个算法所触发的Item 特点各有不同,算法的特征(算法名,算法权 重(或者item 在该算法下的排序)等),item 和算法相关的特征(item 的质量度、相关 性、新颖性等分量)如果证明它们和CTR 是相关的,那么这些特征也是可以用到AS rerank 模型中。 5. 因为目前AS 只是把CTR 作为优化目标,而每个 RS 算法在相关性上的指标不同,尤其 是 MultiStat 算法本身更重视质量度(PV 和 CTR 应该是正相关的)而不是相关性。AS 中需要加入更多相关性的特征。 6. 展现次数:后面可以把展现次数作为特征用到pCTR 模型中。(CTR 应该会有提升,召回 会降低。召回的降低建议是通过提高RS 触发质量来做,而不是通过补余); AS-ReRank 中对时效性的考虑(☆) 1. 新的Item 能够较快得推出来; 2. 不同时间下同一个页面能够推荐出来的Item 有变化。Time-sensitive recommendation : 对于时效性比较强的 domain ;以及一些对于早上/ 晚上,平时/周末 等的考虑。以及对 于用户行为的更为细节的一些考虑(比如两个连续行为;在新Item 上的行为和在老item 上的行为的差异)。 多个触发通道的公平性 每个推荐方法的分数转化为正态分布:根据每个推荐方法的打分情况,normalize 为它的置 信度:各个不同方法初始打分方法不一样(有的是 0-1 之间的比例,有的是交集数量这样 的数值)。转化为正态分布的公式为:若原得分为x ,则转化为 (x- \average ) / \variance ,其 中 \average 为原数值的均值, \variance 为方差。 这样,对于每个方法的推荐列表,它都 有个初始的置信度打分。这样各个方法之间的打分可以相互比较了(正态分布的转化不一定 合理)。得分权重和CTR 成正比,所以权重作为特征是有必要的。公式中能够得到每个方法 (以及Site×方法的权重)。在最后计算权重的时候用“每个Item 的权重 = 模型得

文档评论(0)

1亿VIP精品文档

相关文档