一种有效缓解数据稀疏问题的协同过滤推荐算法.docVIP

  • 18
  • 0
  • 约4.59千字
  • 约 7页
  • 2016-10-06 发布于北京
  • 举报

一种有效缓解数据稀疏问题的协同过滤推荐算法.doc

一种有效缓解数据稀疏问题的协同过滤推荐算法.doc

一种有效缓解数据稀疏问题的协同过滤推荐算法   〔摘 要〕传统协同过滤推荐算法依据共同评分项目计算用户相似度,进而产生推荐项目。然而,随着用户和商品数量的不断增加,用户共同评分的项目会越来越少,甚至没有,因此传统协同过滤推荐算法对用户之间相似度的衡量将会越来越不准确,从而影响推荐系统的性能。针对这一问题,本文对用户相似度的计算方法进行了改进,提出直接相似度和间接相似度的概念,同时引入关键人物权重,进一步提高推荐系统的准确性。   〔关键词〕电子商务;推荐系统;协同过滤;直接相似度;间接相似度;关键人物   DOI:10.3969/j.issn.1008-0821.2016.03.013   〔中图分类号〕TP301 〔文献标识码〕A 〔文章编号〕1008-0821(2016)03-0076-04   〔Abstract〕In traditional collaborative filtering recommendation Algorithm,similarity of users is often calculated based on common ratings,and then the recommended items are produced.However,with the increasing number of users and products,the common rated items will be less and less,and even no.So the measure of the similarity of users will be more and more inaccurate,and thus it will affect the performance of the recommendation system.In order to solve this problem,the method of calculating the similarity of users is improved,and the concepts of direct similarity and indirect similarity are put forward.At the same time,in order to further improve the accuracy of the recommendation system,the key figure is introduced into the system.   〔Key words〕e-commerce;recommending system;collaborative filtering;direct similarity;indirect similarity;key figures   随着电子商务的迅速发展,电子商务网站平台的商品越来越多,同时相当多的用户面临着海量的商品往往不知如何下手,必须花费大量的时间和精力来寻找所需的信息,因此智能推荐系统在电子商务网站中尤为重要。协同过滤推荐是目前最好的一种推荐技术[1],其根据用户的评分数据进行项目推荐。传统的协同过滤推荐技术虽然一段时间内发挥了很大的作用,然而随着电子商务网站规模的不断扩大,协同过滤推荐技术面临着众所周知的严重问题[2]:(1)“稀疏性”问题:用户-项目评价矩阵非常稀疏;(2)“冷启动”问题:一个新的商品出现时,用户对其评分会特别少,甚至没有,那么这个商品就不容易被推荐出去。另外,一个新用户加入时,由于没有对任何项目进行过评价,系统就无法对其进行推荐。(3)“可扩展性”问题:面对用户和商品数量的日益增多,系统的性能会越来越低。   为了解决数据稀疏而导致的推荐结果不准确问题,许多学者提出了各自不同的方法。目前常用的方法有以下几种:(1)数据填充:在计算用户相似性之前,首先对原始的用户-项目评分矩阵进行填充,从而降低其稀疏性,提高推荐准确度。郝立燕等[3]根据原始矩阵中评分数据的特征,采用SOFT-IMPUTE算法对评分矩阵进行填充,然后利用填充后的矩阵计算用户相似性,进而做出推荐预测。张玉芳等[4]采用分两步对原始评分矩阵进行填充的方法。首先在利用传统协同过滤推荐算法寻找目标用户邻居集时,只考虑相似度比较高的用户作为目标用户邻居,进而对评分矩阵进行第一次填充,然后将第一步填充后的矩阵作为新的用户-项目矩阵,在此基础上进行第二次填充,此方法可以很好的解决数据稀疏问题。黄永锋等[5]在原始评分矩阵基础上,首先根据用户访问过的项目的特征及访问频率对用户访问过但没有给出评价的项目进行填充,从而降低原始评分矩阵的稀疏度,提高推荐准确性。(2)

文档评论(0)

1亿VIP精品文档

相关文档