用户特征协同过滤方法在个性化商品推荐中应用探究.docVIP

用户特征协同过滤方法在个性化商品推荐中应用探究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用户特征协同过滤方法在个性化商品推荐中应用探究

用户特征协同过滤方法在个性化商品推荐中应用探究   摘要:协同过滤推荐是目前个性化推荐中应用最广泛的推荐技术,根据电子商务网站中用户的特征,重点分析了协同过滤推荐方法,发现目前协同过滤算法主要利用用户评分数据进行推荐,数据单一且稀疏,因此在用户评分数据的基础上,对用户属性特征和用户喜好特征数据加以利用,提出了一种基于用户特征数据的协同过滤推荐方法,能够缓解目前算法中存在的数据稀疏问题,通过实验数据对比分析,证明了算法的合理与有效性 关键词:推荐系统;用户特征;协同过滤;数据稀疏 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)31-0157-03 ?S着互联网的发展,电子商务也得到了飞速发展。电子商务规模的不断扩大,使得用户一方面可以方便地获得丰富的信息,另一方面则要面临过量信息伴随着的信息过载问题[1]。在此背景下,电子商务推荐系统应运而生,国内外越来越多的电子商务网站应用推荐技术用户进行个性化推荐。例如淘宝、京东、亚马逊等大型网站[2]都有自己的推荐模块,用于提升其销售量。亚马逊(Amazon)是美国最大的在线电子商务网站,就实现了基于协同过滤的混合类型推荐 协同过滤推荐算法是研究和应用最为广泛的一种算法[3],常用的协同过滤推荐算法是基于用户的协同过滤算法,其基本原理是利用已知用户的历史评分数据找到目标用户的相似用户,根据相似用户的评分数据对目标用户产生推荐。但是由于商品信息成千上万,每个用户真正购买的商品却很少,所以评分信息往往更少,数据稀疏[4]问题明显。常用的协同过滤算法只是对用户――项目评分信息进行分解,没有充分利用数据信息[5],没有考虑到用户的性别特征、年龄特征和购买特征等用户特征,而利用这些特征数据能有效地提高协同过滤的推荐精度,并且这些数据简单易得,数据量也明显比评分数据量大,为此本文提出对用户特征数据进行建模,利用用户购买、收藏和浏览特征对用户-项目评分矩阵中的值进行预测和填充,能够缓解数据集的稀疏问题,并综合用户自身属性相似度和评分相似度进行相似度计算,实验表明,该算法缓解了评分矩阵的稀疏问题,提高了推荐质量 1 常用协同过滤推荐方法 1.1 常用协同过滤推荐方法的一般步骤 1) 收集用户评分数据,进行清理、转换等,得到一个用户-项目评分矩阵,m代表用户数量,n代表项目数量,代表用户u对项目的评分,取值范围为0到5之间的整数, 0表示未评分,分值越大,喜好程度越大 2) 利用相似度计算方法计算用户-项目评分矩阵中目标用户与其他用户的相似度,找到用户的相似邻居。通常采用K近邻方法[6],获得目标用户相似度最高的K个用户作为目标用户的相似邻居 3) 按照给定计算方法,通过用户相似邻居对目标用户未评分项目的评分数据,对目标用户未评分项目进行评分预测,最终选择Top-N作为目标用户的推荐集合,推荐给目标用户 1.2 相似度计算 用表示用户和用户的相似性,设表示用户、的共同评分项目集合,向量分别表示用户、在上的评分,用户、在n维项目空间上的评分分别用,表示,、分别表示用户和用户对已评分项目的平均评分 1.3 常用协同过滤算法存在的问题 随着用户和项目规模不断扩大,常用的协同过滤算法面临着数据稀疏性、可拓展性和冷启动的问题。用户和商品在不断增加的过程中,用户评过分的商品只占非常小的一部分,这就造成了评分数据的稀疏性,影响推荐效果。针对这个问题,本文发现通过结合用户的特征数据和协同过滤算法,可以构建出填充过的用户-项目评分矩阵,从而缓解稀疏性,提高协同过滤推荐的质量。同时,由于用户的属性特征较为稳定,购买、收藏和浏览特征也存在一定规律,上述的计算过程可以离线进行,对推荐效率影响较小 2 基于用户特征的协同过滤推荐方法 2.1 用户特征定义 通常将电子商务网站的用户特征分为属性特征和喜好特征,属性特征一般通过用户的基本属性即用户登录和注册时主动提供的信息得到,一般用户比较愿意提供性别、生日等不敏感的信息,而喜好特征即通过对用户购买行为、收藏行为和浏览行为等分析出的用户喜好,即用户对商品的购买、收藏和浏览以及它们的次数能不同程度的反应用户的喜好,因此本文定义用户的属性特征包括用户的性别特征和年龄特征,用户的喜好特征包括用户的购买、收藏和浏览特征 2.2 方案设计 基于用户特征的协同过滤推荐方案采用离线计算推荐结果的方式,将计算结果保存在数据库中,用户登录后直接在线读取数据库中已经计算好的数据即可,这样的方式虽然对存储空间有一定牺牲,但是保证了在线推荐的效率,当用户和商品增加时,推荐的可拓展性也可以得到保证,对推荐效率影响较小。推荐的整体流程见图1 从图1可以看出离线计算的部分,首先,通过计算用户

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档