机器学习讲义-推荐系统--排序篇1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习讲义-推荐系统--排序篇1

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 排序介绍 作业1:写代码算MAP 排序介绍 排序指标 NDCG指标 排序介绍 排序指标 item score label i3 0.85 5 i2 0.73 0 i5 0.65 0 i7 0.52 1 item score label i2 0.91 1 i1 0.63 5 i7 0.50 1 i8 0.41 0 NDCG@4=? NDCG@4=? 排序介绍 排序指标 item score label 分子 分母 i3 0.85 5 31 1 i2 0.73 0 0 log2(3) i5 0.65 0 0 log2(4) i7 0.52 1 1 log2(5) DCG@4=31+1/log2(5) 排序介绍 排序指标 item label 分子 分母 i3 5 31 1 i2 0 0 log2(3) i5 0 0 log2(4) i7 1 1 log2(5) DCG@4=31+1/log2(5) item label 分子 分母 i3 5 31 1 i7 0 1 log2(3) i5 0 0 log2(4) i2 0 0 log2(5) IDCG@4=31+1/log2(3) nDCG=DCG/IDCG 排序介绍 排序指标 item score label i2 0.91 1 i1 0.63 5 i7 0.50 1 i8 0.41 0 DCG=? IDCG=? 排序介绍 排序指标 DCG@4=3/2+31/log2(3) IDCG@4=63/2+1/log2(3) item label 分子 分母 i2 1 1 log2(2) i1 5 31 log2(3) i7 1 1 log2(4) i8 0 0 log2(5) item label 分子 分母 i1 5 31 log2(2) i2 1 1 log2(3) i7 1 1 log2(4) i8 0 0 log2(5) 排序介绍 作业2:写代码算NDCG 排序介绍 排序指标 MRR指标 排序介绍 排序流程 数据 预处理 特征抽取 模型训练 后处理 排序介绍 排序流程 数据 预处理 特征抽取 模型训练 后处理 排序介绍 预处理 skip above position bias去除 pair生成 排序介绍 怎样确定用户看到了? 好的位置? 埋点? 排序介绍 skip above 排序介绍 position bias 排序靠前,即使不是用户感兴趣的item,点击下单也会多 排序介绍 position bias Click Over Expect Click 排序介绍 position bias Click Model 这样CTR被分解为: 位置偏向性 相关性 排序介绍 position bias 其他方法 训练时候带有位置特征,预测的时候去掉 排序介绍 排序流程 数据 预处理 特征抽取 模型训练 后处理 排序介绍 特征抽取 不同类型模型,特征也不一样 线性模型/因子模型 离散化 组合 树模型 数值化 排序介绍 特征抽取 id类特征 线性模型/特征模型 One Hot Encoding 树模型 基于id的统计特征 排序介绍 特征抽取 数值特征 线性模型/特征模型 * * * * * * * * * * */48 互联网新技术在线教育领航者 LOGO 之前的问题 AUC为0.3240? 在CTR预估评价中会用LogLoss,为什么不是其他的Loss Function,还是其他的loss function也可以? log loss一定是凸函数吗?怎么证明? 之前的问题 机器学习实训营第一次作业train数据有整行重复的数据,需不需要去重? 在CTR预测中,在抽取特征的过程中,用到了map的形式,在python中用了dict,那么当特征维度过大的时候怎么办,如超出字典的最大长度。实际应用中有没有什么更为巧妙而成熟的实现方式? 之前的问题 test集预测结果后,计算auc的值一直为1? 问:测试集没有标签,怎么计算的AUC? 答:测试集没有label,设置一个阈值为0.5,大于0.5,label为1,小于0.5,label为0,然后计算auc。 推荐系统—排序篇 什么是推荐系统? 物品 推荐系统 推荐系统是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的物品的系统 推荐系统两个阶段 召回阶段 排序阶段 召回出用户感兴趣的item 对这些item排序后展示给用户 推荐系统两个阶段 召回算法 基于内容 基于协同过滤 冷启动相关算法 推荐系统两个阶段 排序介绍 什么是排序 决定item以何种顺序展示给用户

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档