去流行度偏差的推荐方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

去流行度偏差的推荐方法研究

摘要

推荐系统和自然语言处理、计算机视觉并称为机器学习三大方向,随着机

器学习以及深度学习的发展,推荐系统也得到了长足的发展,无论是学界还是

工业界推荐系统都得到了许多研究人员的关注,在生活中也不难在电商购物、

社交平台、视频平台等等常用的应用中直接应用推荐系统。然而因为存在数据

的偏差,在统计学界也是重要的随机数据缺失问题(MAR),导致推荐系统一直

存在流行度偏差,这种偏差会导致推荐系统一直偏向推荐交互量大的流行商

品,但是这就导致推荐系统的趋同,严重影响用户体验。

本文首先使用T-SNE降维商品嵌入,验证了流行度偏差的普遍存在,针对

流行度偏差问题,本文提出了两种解决方法,第一种方案主要目标是构建无偏

的商品嵌入,根据实验我们发现流行度偏差可以当作一种商品的内在属性,在

第三章中提出了一种解耦流行度去偏差的方法,在数据集中对每个商品根据总

交互量化分流行和非流行商品组,通过聚类算法进行拟合,达到解耦流行度去

偏差的目的,最后用正交损失遗忘流行度信息,最后再进行下一步的推荐任

务。但是这个方法是模型固定的,不能再套用到其它的模型中,故本文第一个

方法不能解决绝大多数基模型的去偏需要。

针对第一个方法的问题,本文又提出了第二个去偏方法,本文利用了经典

的Skip-Gram嵌入算法的流行度负采样方式,这种负采样方式原本是为加速计

算,在本文中发现可以有效缓解流行度偏差,本文利用这种负采样方式,构建

了模型无关的去偏框架,在这种框架下,可以在保证基模型的精度的情况下,

在流行度指标上取得很好的效果,解决我们第一个模型的缺点。

本文还提出了两种衡量模型流行度偏差程度的指标,在多个数据集和基模

型下,进行了有效的对比实验,验证本文提出的方法可以有效缓解流行度偏

差,为学界和业界提出有效的解决方案。

关键词:深度学习;推荐系统;流行度偏差;注意力机制;负采样

去流行度偏差的推荐方法研究

Abstract

Recommendationsystem,naturallanguageprocessingandcomputervisionare

knownasthethreemajordirectionsofmachinelearning.Withthedevelopmentof

machinelearninganddeeplearning,recommendationsystemhasalsoachievedgreat

development.Recommendationsystemhasattractedtheattentionofmanyresearchers

bothinacademiaandindustry.Indailylife,itisnotdifficulttodirectlyapplythe

recommendationsystemincommonapplicationssuchase-commerceshopping,

socialplatforms,videoplatformsandsoon.However,duetothedatadeviation,

whichisalsoanimportantproblemofmissingrandomdata(MAR)inthestatistical

field,therecommendationsystemalwayshasthepopularitydeviation.Thisdeviation

willleadtotherecommendationsystemalwayspreferringpopularcommoditieswith

alargenumberofrecommendedinteractions,butthisleadstotheconvergenceofthe

recommendationsystemandseriouslyaffectstheuserexperience.

文档评论(0)

n1u1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档