- 2
- 0
- 约 9页
- 2017-02-02 发布于湖北
- 举报
赛题介绍
本赛题适用于season1 和season 2的比赛,season 3 为线上赛(season 2 赛后公布题目)。?在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。
我们会开放如下数据类型:
字 段 字段说明 提取说明 user_id 用户标记 抽样字段加密 Time 行为时间 精度到天级别隐藏年份 action_type 用户对品牌的行为类型 包括点击、购买、加入购物车、收藏4种行为?(点击:0 购买:1 收藏:2 购物车:3) brand_id 品牌数字ID 抽样字段加密 用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。
评估指标
我们希望参赛队的预测, 预测的品牌准确率越高越好,也希望覆盖的用户和品牌越多越好,所以用最常用的准确率与召回率作为排行榜的指标。
准确率:?注:?N 为参赛队预测的用户数?pBrandsi为对用户i 预测他(她)会购买的品牌列表个数?hitBrandsi对用户i预测的品牌列表与用户i真实购买的品牌交集的个数
召回率:
原创力文档

文档评论(0)