- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
协同过滤算法在电影系统中应用
协同过滤算法在电影系统中应用
摘要:在大量电影中如何快速找到自身所喜爱的影片是一个很重要的问题,特别是在观众没有明确目标时,推荐系统则可发挥至关重要的作用。结合电影推荐系统的实际需求,通过阐述和分析协同过滤算法的特点和不足,提出了一种改进的协同过滤算法用于电影推荐中,改进了数据稀疏导致推荐系统正确性不高的问题,提高了系统的可靠性。
关键词:协同过滤;数据稀疏;电影推荐系统
DOIDOI:10.11907/rjdk.151400
中图分类号:TP312
文献标识码:A 文章编号文章编号2015)008009202
0 引言
协同过滤算法是推荐系统的主要算法。本文简单介绍了协同过滤算法,表明数据稀疏是协同过滤算法的一个主要问题,解决数据稀疏问题可以提高协同过滤算法的可靠性及准确度。针对数据稀疏问题提出了自己的见解,将前人对协同过滤算法的改进用于电影推荐系统中,在一定程度上解决了由数据稀疏导致的推荐系统可靠性不高的问题。
1 协同过滤算法与数据稀疏问题
协同过滤(Collaborative Filtering)主要有3种推荐算法:基于用户(uersbased)的推荐算法和基于项目(itembased)的推荐算法[1]。协同过滤算法存在的主要问题有冷启动问题、数据稀疏问题、实时性问题、空间扩展问题。冷启动问题是数据稀疏问题的一个特例。本文采用基于用户的推荐算法。
基于用户的推荐算法是通过分析不同用户对物品的评分,通过模型计算用户之间的相似度,然后基于用户的相似度进行推荐。
首先输入用户资料,建立用户资料数据库。同时通过收集用户的历史行为和评分行为,将这些行为转换为用户对物品的评分,建立用户评分矩阵。
然后建立最近邻集,针对目标用户和数据库中的所有用户进行计算,找到相似度较高的用户建立最近邻集。计算用户之间相似度的常用方法有Person相关系数(见式1)、余弦相关性系数(见式2)和修正余弦相关性系数[2](见式3)。
最后得出推荐结果。根据建立的最近邻集,计算评测值(见式4),根据评测值大小进行推荐。
根据上述步骤可以看出,用户的评分决定用户相似度。所以,用户的评分数据稀疏会导致用户相似度误差很大,推荐系统的可靠性不高。解决数据稀疏问题是提高推荐系统可靠性的关键。
2 改进的协同过滤算法
数据稀疏是影响协同过滤算法的主要问题。解决数据稀疏问题的基本方法有简单填充法、基于聚类的方法、相似度传递法等。对稀疏矩阵进行填充是这些方法的核心思想。本文运用一种改进的协同过滤算法改善数据稀疏问题。改进算法的思想是改进填充数据稀疏矩阵的数值,提高协同过滤算法的可靠性。首先在最近邻集中计算目标用户与最邻近之间的相似度,每个最近邻用户都产生一个预测值[4],如式(5)所示:
Rai,y=Ra+sim(i,a)(Ri,y-Ri)0 Rai,y≠0Rai,y=0(5)
其中,Rai,y表示目标用户a的最近邻i对项目y的预测评分,Ri,y表示用户i对项目y的实际评分,Ra、Ri分别表示用户a和用户i的评分均值,sim(i,a)表示用户a和用户i的相似度。由此得到一个预测评分矩阵,在此基础上根据式(6)得到评分矩阵。
Pa,y=∑i∈Nsim(i,a)×Rai,y∑i∈Nsim(i,a)(6)
3 实验结果
现通过实验来验证改进策略的有效性。实验所用数据来自Movielens数据集,实验所得数据是改进策略的精度值,如图1所示。图1表明改进的协同过滤算法的精度值在0.8~1之间,比较稳定,误差不大。精度值的数值较高,说明该算法具有有效性。因此,实验结果表明,改进的协同过滤算法误差小、稳定性高,且具有有效性。
图1 改进的协同过滤算法的精度值
4 电影推荐系统模型
通过对现有电影推荐系统的观察和研究,结合上述改进算法,本文设计提出基于协同过滤的电影推荐系统模型,如图2所示。
5 结语
本文简单介绍了协同过滤算法,通过分析协同过滤算法及其存在的数据稀疏问题,设计提出了电影推荐系统模型,并在电影推荐系统中运用了一种改进策略,改善了数据稀疏性问题,提高了电影推荐系统的可靠性及准确度。但是改进算法的精度还存在一定误差,有待进一步提高。
参考文献:
[1] 许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2):350362.
[2] 王洋,骆力明.一种解决协同过滤数据稀疏性问题的方法[J].首都师范大学学报:自然科学版,2012,33(4):15.
[3] 查大元.个性化推荐系统的研究和实现[J].计算机应用与软件,2011,28(l):4749
文档评论(0)