- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于加权因子混合协同过滤算法
一种基于加权因子的混合协同过滤算法
摘要:为改进传统协同过滤算法的准确率问题,该文提出一种基于加权因子的混合协同过滤算法。该算法核心是将传统的用户和物品协同过滤算法预测集合进行交集运算,并对其评分进行加权混合得到推荐结果。通过在MovieLens-100k数据集上与传统协同过滤算法进行比较,结果表明,该文的混合协同过滤算法在平均绝对误差和均方根误差两个评价指标上都优于传统协同过滤算法。
关键字:协同过滤;混合协同过滤;MovieLens-100k数据集
中图分类号:TP31 文献标识码:A 文章编号:1009-3044(2018)09-0014-03
Abstract: In order to improve the accuracy of traditional collaborative filtering algorithm, this paper proposes a hybrid collaborative filtering algorithm based on weighting factors. The core of this algorithm is to combine the traditional user and item collaborative filtering algorithm to get the recommended result. Compared with the traditional collaborative filtering algorithm on MovieLens-100k data set, the results show that the hybrid collaborative filtering algorithm is superior to the traditional collaborative filtering algorithm in both average absolute error and root mean square error.
Key words: Collaborative filtering; Hybrid collaborative filtering; MovieLens-100k data set
协同过滤算法是通过用户和网页的互动过滤掉用户不喜欢的商品,从而对用户进行推荐。最早于1992年被应用于邮件过滤系统,之后又被GroupLens应用于新闻过滤系统,直至今日,仍被各大电商网站,如淘宝、京东所应用。然而经过大量学者研究发现,协同过滤算法存在几个不足之处:冷启动性,数据稀疏性,可扩展性和准确性问题。其中,端德坤和傅秀芬针对冷启动性问题进行了研究,通过引入用户信任机制和人口统计学信息对其进行改进,在一定程度上对冷启动性问题进行了缓解[1]。何佳知是将基于内容和协同过滤算法相结合,并融入了k-means算法,有效地解决数据稀疏性这一问题[2]。但准确率仍然是推荐算法最核心的问题。本文则针对准确性问题,提出了一种混合协同过滤算法,该算法通过加权因子将基于用户的和基于物品的协同过滤算法相结合。并在MovieLens-100k数据集上进行测试比较,结果表明本文的混合协同过滤算法在准确率方面有显著提高。
1传统的协同过滤算法概述
协同过滤算法被分为两大类:基于内存的协同过滤算法和基于模型的协同过滤算法。其中基于内存的协同过滤算法由分析目标的差异被分为:基于用户的协同过滤算法(UCF,user-based collaborative filtering)和基于物品的?f同过滤算法(ICF,item-based collaborative filtering)。本文算法主要将基于内存下的两类算法进行混合,下面详细介绍基于用户和基于物品的协同过滤算法。
1.1 基于用户的协同过滤算法
基于用户的协同过滤算法核心思想是给用户推荐与其兴趣相似的用户所喜欢的物品,主要根据用户相似度和用户行为数据信息进行预测推荐。该算法实现需要两个步骤:
(1)找到和目标用户相似的用户群体。用户之间的相似度通常使用皮尔逊相关系数、余弦相似度或修正的余弦相似度公式来度量[3],公式定义分别如下所示:
其中,[Rui]和[Rvi]分别表示用户u和用户v对物品i的评分值,[Iuv]表示用户u和用户v有过评分物品集合的交集,[R_u]和[R_v]分别表示用户u和用户v有过物品评分的平均值。
(2)根据用户之间的相似度,通过公式(1.4)计算目标用户u对物品i的预测评分:
其中,[Rui]表示用户u对物品i的预测评分,[NUu]表示与用户u相似的用户集合。
1.2 基
文档评论(0)