网站大量收购独家精品文档,联系QQ:2885784924

协同过滤算法在电影系统中应用.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
协同过滤算法在电影系统中应用

协同过滤算法在电影系统中应用   摘要:在大量电影中如何快速找到自身所喜爱的影片是一个很重要的问题,特别是在观众没有明确目标时,推荐系统则可发挥至关重要的作用。结合电影推荐系统的实际需求,通过阐述和分析协同过滤算法的特点和不足,提出了一种改进的协同过滤算法用于电影推荐中,改进了数据稀疏导致推荐系统正确性不高的问题,提高了系统的可靠性。   关键词:协同过滤;数据稀疏;电影推荐系统   DOIDOI:10.11907/rjdk.151400   中图分类号:TP312   文献标识码:A 文章编号文章编号2015)008009202   0 引言   协同过滤算法是推荐系统的主要算法。本文简单介绍了协同过滤算法,表明数据稀疏是协同过滤算法的一个主要问题,解决数据稀疏问题可以提高协同过滤算法的可靠性及准确度。针对数据稀疏问题提出了自己的见解,将前人对协同过滤算法的改进用于电影推荐系统中,在一定程度上解决了由数据稀疏导致的推荐系统可靠性不高的问题。   1 协同过滤算法与数据稀疏问题   协同过滤(Collaborative Filtering)主要有3种推荐算法:基于用户(uersbased)的推荐算法和基于项目(itembased)的推荐算法[1]。协同过滤算法存在的主要问题有冷启动问题、数据稀疏问题、实时性问题、空间扩展问题。冷启动问题是数据稀疏问题的一个特例。本文采用基于用户的推荐算法。   基于用户的推荐算法是通过分析不同用户对物品的评分,通过模型计算用户之间的相似度,然后基于用户的相似度进行推荐。   首先输入用户资料,建立用户资料数据库。同时通过收集用户的历史行为和评分行为,将这些行为转换为用户对物品的评分,建立用户评分矩阵。   然后建立最近邻集,针对目标用户和数据库中的所有用户进行计算,找到相似度较高的用户建立最近邻集。计算用户之间相似度的常用方法有Person相关系数(见式1)、余弦相关性系数(见式2)和修正余弦相关性系数[2](见式3)。   最后得出推荐结果。根据建立的最近邻集,计算评测值(见式4),根据评测值大小进行推荐。   根据上述步骤可以看出,用户的评分决定用户相似度。所以,用户的评分数据稀疏会导致用户相似度误差很大,推荐系统的可靠性不高。解决数据稀疏问题是提高推荐系统可靠性的关键。   2 改进的协同过滤算法   数据稀疏是影响协同过滤算法的主要问题。解决数据稀疏问题的基本方法有简单填充法、基于聚类的方法、相似度传递法等。对稀疏矩阵进行填充是这些方法的核心思想。本文运用一种改进的协同过滤算法改善数据稀疏问题。改进算法的思想是改进填充数据稀疏矩阵的数值,提高协同过滤算法的可靠性。首先在最近邻集中计算目标用户与最邻近之间的相似度,每个最近邻用户都产生一个预测值[4],如式(5)所示:   Rai,y=Ra+sim(i,a)(Ri,y-Ri)0 Rai,y≠0Rai,y=0(5)   其中,Rai,y表示目标用户a的最近邻i对项目y的预测评分,Ri,y表示用户i对项目y的实际评分,Ra、Ri分别表示用户a和用户i的评分均值,sim(i,a)表示用户a和用户i的相似度。由此得到一个预测评分矩阵,在此基础上根据式(6)得到评分矩阵。   Pa,y=∑i∈Nsim(i,a)×Rai,y∑i∈Nsim(i,a)(6)   3 实验结果   现通过实验来验证改进策略的有效性。实验所用数据来自Movielens数据集,实验所得数据是改进策略的精度值,如图1所示。图1表明改进的协同过滤算法的精度值在0.8~1之间,比较稳定,误差不大。精度值的数值较高,说明该算法具有有效性。因此,实验结果表明,改进的协同过滤算法误差小、稳定性高,且具有有效性。   图1 改进的协同过滤算法的精度值   4 电影推荐系统模型   通过对现有电影推荐系统的观察和研究,结合上述改进算法,本文设计提出基于协同过滤的电影推荐系统模型,如图2所示。   5 结语   本文简单介绍了协同过滤算法,通过分析协同过滤算法及其存在的数据稀疏问题,设计提出了电影推荐系统模型,并在电影推荐系统中运用了一种改进策略,改善了数据稀疏性问题,提高了电影推荐系统的可靠性及准确度。但是改进算法的精度还存在一定误差,有待进一步提高。   参考文献:   [1] 许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2):350362.   [2] 王洋,骆力明.一种解决协同过滤数据稀疏性问题的方法[J].首都师范大学学报:自然科学版,2012,33(4):15.   [3] 查大元.个性化推荐系统的研究和实现[J].计算机应用与软件,2011,28(l):4749

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档