美团生活服务个性化推荐实践课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
美团生活服务个性化推荐实践课件

美团生活服务 个性化推荐实践 美团网 张彬 微信:Idealist 推荐@美团 面临的问题 应对方案 总结 推荐@美团 活跃用户过亿,移动端交易占80%以上 推荐平台 Mobile PC 推荐实体 商家(poi) 团购单(deal) 推荐形式 User2Items Item2Items Personal push Others 推荐产品 10+推荐产品,每天服务 30M+ 用户 推荐@美团 推荐@美团 其他: 购买完成,评价完成,搜索无结果,附近团购,相关团购 面临的问题 用户购买与消费的空间距离很小 分品类持券80%距离 关键词:本地化 面临的问题 用户购买与消费的时间差很短 分品类持券时长 面临的问题 用户场景时刻在变化 地理位置不断变化 用户需求随位置而变 推荐的内容要适配这种变化 面临的问题 用户行为稀疏,粘性不够强 相邻两次访问的时间间隔长 新用户流失比例高,生命周期偏短 面临的问题 数据多,用户请求量大 每天要处理的数据达到T级别 每天千万级的用户,上亿次请求 应对方案 强化地理位置特征 提高算法实时性 算法融合,个性化push 框架优化 地理位置 实时地理位置 常去地理位置 工作地 居住地 消费地 地理位置的维度 地理位置 离线:挖掘区域消费优质deal和区域购买优质deal 在线:获取用户的地理位置信息,对区域deal列表进行加权 地理位置直接触发 地理位置 根据用户的地理位置轨迹计算用户相似度,与协同的用户相似度叠加 User1:geo1:count1; geo2:count2; geo3:count3 … User2:geo1’:count1’; geo2’:count2’; geo3’:count3’ … 地理位置 基于消费poi的相似度计算 Deal中包含的地理位置信息较弱 Poi同时包含了用户的偏好与商圈倾向 地理位置 作为重排序模型的特征 用户实时地理位置与deal所在poi的最近距离 用户常去地理位置与deal所在poi的最近距离 用户消费地理位置与deal所在poi的最近距离 实时推荐 用户场景经常变化,需求随之而变 离线计算好结果的推荐方式适应性差 每次请求都要实时计算 实时推荐 实时数据流 实时行为:搜索、筛选、收藏、浏览、下单 实时推荐 实时数据流 算法使用新的用户行为数据进行推荐 未转化行为实时反馈至推荐结果 实时推荐 实时数据流 Query:火锅 未转化 二次到达 实时推荐 算法准实时更新 Itembased cf 小时级更新 看了又看:6%+ 提升 Userbased cf 准实时更新 增量计算 4小时更新一次 实时推荐 实时rerank 子算法计算出来的权重考虑的因素太少 不同子算法的权重不具有可比性 实时推荐 实时rerank 模型选择 线性、非线性结合 特征 deal维度的特征 user维度的特征 user、deal的交叉特征 距离特征 实时推荐 实时rerank 在线特征抽取,模型实时计算 在线学习算法FTRL 算法融合push 单一算法覆盖有限,融合可以提高覆盖度 从多个维度触发,增加多样性 算法融合 算法融合push 算法融合 加权型:对各个算法产生的候选集按照权重进行加权 分级型:优先采用效果好的算法,再使用效果次好的算法,依此类推 调制型:不同的算法按照不同的比例产生一定量的候选集组成总的候选集 过滤型:当前的算法对前一级算法产生的候选集进行过滤,依此类推,候选集被逐级过滤,最终产生一个小而精的候选集合 算法融合push 适应稀疏性的算法 LLR相似度:loglikelihood ratio 图算法:simrank 算法融合push 用户相邻两次访问间隔长 触及更多的用户,提升日活用户数 不能过度打扰用户 个性化push 算法融合push 最初的做法:用户拉取 Push时机不可调 系统压力大 不能实时推荐 个性化push:时机优化 算法融合push 改为push以后: 根据用户的历史联网时间确定push发送时机 根据用户的实时定位发送 发出率提高24%,打开率提高21%,综合转化率提高94% 个性化push:时机优化 框架优化 行为类别 行为详情 主动行为数据 搜索、筛选、点击、收藏、下单、支付、评分 UGC 文本评价、上传图片 负反馈数据 左滑删除、取消收藏、取消订单、退款、负评、低评 用户画像 用户人口属性、美团DNA、品类偏好、消费水平、工作地与居住地 数据 框架优化 海量数据的处理 框架优化 日益增长的用户请求 将业务进行拆分,较重的业务独立出来 多算法并行 统一数据模型,减少冗余请求 框架优化 快速的效果迭代 触发层与排序层分离 模型训练并行化 参数实时加载,支持快速调参 总结 地理位置因素的引入:解决用户冷启动和稀疏性,提高推荐精度 将候选

文档评论(0)

maxmin + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档