推荐系统常用的推荐算法_光环大数据培训[参考].pdfVIP

推荐系统常用的推荐算法_光环大数据培训[参考].pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据 --大数据培训 人工智能培训 推荐系统常用的推荐算法 _光环大数据培训 一、推荐系统概述和常用评价指标 1.1 推荐系统的特点 在知乎搜了一下推荐系统, 果真结果比较少,显得小众一些,然后大家对推 荐系统普遍的观点是: (1) 重要性 UI数据 算法,就是推荐系统中一味追求先进的算法算是个误区, 通常论文研究类的推荐方法有的带有很多的假设限制, 有的考虑工程实现问题较 少,推荐系统需要大量的数据整理和转化, 同时更需要考虑公司业务特性以及与 现有系统的集成,方能形成推荐系统和业务之间的良性循环 ; (2) 推荐系统离线测试很好, 上线后要么没有严格的测试结果而只能凭感觉, 要么实际效果差强人意,我想主要缘于离线测试比较理想,而在线 AB 冠军测试 无论对于前端还是后台要求都很高,没有雄厚的研发实力难以实现 ; (3) 推荐系统受到的外部干扰因素特别多 ( 季节、流行因素等 ) ,整个系统需 要不断的迭代更新,没有一劳永逸的事情。 1.2 推荐系统的评价指标 由于推荐系统比较复杂, 所以涉及到的评价指标也很多。当然,用户满意度 最为的有效, 因为这本来就是推荐系统的最终目标, 但是奈何资源有限成本太高, 推荐系统还依赖于其它客观评价指标。 光环大数据 1 / 8 光环大数据 --大数据培训 人工智能培训 (1) 推荐准确度:这个参数可以离线计算所得,而且较为的客观,所以是各 大研究论文算法最重要的参考指标。 总体来说,推荐系统有两大任务: “预测”和“推荐”,所以推荐系统准确度 的评分包括: 评分预测:学习用户的评价模型, 用于预测用户对于未接触事物的评分, 其实可以看作是一个回归模型,一般用均方根误差或者绝对误差来衡量 ; TopN 推荐:给用户一个个性化的推荐列表,其一般通过准确度、召回 率等指标评估。 其中 N也是一个可变参数, 可以根据不同的 N描绘出对应算法的 ROC曲线来进一步评价推荐效果 ; (2) 覆盖率:体现了挖掘算法对发掘长尾商品的能力。最简单的定义是,对 所有用户推荐出的产品做并集, 然后看这个出现的并集产品与总产品数中所占的 比例,这种方式比较的粗线条, 因为推荐系统中马太效应频繁, 所以好的推荐算 法应当是所有商品被推荐的几率差不多, 都可以找到各自合适的用户, 所以实际 中会考虑信息熵、基尼系数等指标。 (3) 多样性:其原理可以表述为不在一棵树上吊死。因整个推荐系统涉及到 的因素太多,如果只推荐用户一个类别的相似物品,失败风险比较的大, 而且也 难以实现整个推荐效益的最大化。 (4) 新颖性:原理就是那些用户没有接触过、没有操作过的商品,或者是流 行度比较低的商品,对用户来说是比较新鲜的物品,往往会有意外的效果。 个人 觉得这个指标有点扯 ~~ 光环大数据

文档评论(0)

旺咖 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档