5 阿里移动推荐算法 CHLL.pdf

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
阿里移动推荐算法大赛答辩 CHLL 陈靖 中国科学技术大学 提纲  解题思路  算法介绍  样本  特征  模型  总结回顾  涨分技巧  参赛收获 解题思路 问题描述: 给出一定量用户在11.18~12.18之内的移动端行为数据(D), 需要预测12.19对商品子集(P)的购买数据。行为分为四种:1(浏览) , 2(收藏) ,3(加购物车) ,4(购买) 解题思路  问题 分类问题二分类,1:买,0:不买  样本 样本选取有交互P子集样本 在哪一天交互的样本可能会在19号购买? 16号、17号、18号?  特征 什么样的用户在什么时候对什么样的商品有过什么样的操作之后可能会在 19号购买?是否买过?商品销量?加购物车?  模型 分类、回归。(LR、RF、GBDT ) 解题思路 根据分析构造特征 业务 特征 不同购买模 是否购买交给模型判断 式单独处理 模型 解题思路 第一赛季 数据量小,更换数据前后模型效果波动大 规则过滤:过滤18号的交互样本 cart(u, i) && cart_time(u, i) > 13 && buy_time(u) < cart_time(u, i) F1=9.9 转化成特征 是否加购物车、加购物车时间、用户发生购买行为的时间(小时) 解题思路 第二赛季 D全集 P子集 一天购买数据 前一个月 平均17万左右 有交互的 58亿 5亿 解题思路  购买数据分布 在12.18号购买且前一个月交互过 在12.18号购买且前两天交互过 在12.18号购买且前一天交互过 解题思路  购买数据分布 28215 提交量13万 精度9.8% 5886 提交量1万 精度5% 越往前交互越难预测,购买可能性越低 算法介绍  待预测样本选取 加购物车的样本

文档评论(0)

qingfengxulai + 关注
实名认证
内容提供者

文档来源于网络

1亿VIP精品文档

相关文档