基于近邻评分预测协同过滤推荐算法.docVIP

下载本文档

28
0
约6.39千字
约 12页
2018-06-23 发布于福建
举报
版权申诉

基于近邻评分预测协同过滤推荐算法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于近邻评分预测协同过滤推荐算法

基于近邻评分预测协同过滤推荐算法　　摘要：随着用户数量和网站提供的服务种类的不断增加，这些网站都面临着怎样更精准的给自己的用户推荐他们可能感兴趣的东西。传统的在用户—项目评分矩阵上计算项目之间相似性的方法不够精确，而且当用户—项目评分矩阵很稀疏的时候误差很大甚至无法处理。文中在项目评分相似性计算中考虑了时间信息，在计算项目相似性中融合了项目评分相似性和经过加权处理的项目属性特征相似性。实验结果表明，该算法较之传统的方法能够较好的应对数据稀疏问题，同时提高了推荐结果的精确度。　　关键字：评分预测；推荐系统；协同过滤；特征属性；时间信息　　中图分类号：TP311 文献标识码：A DOI：10.3969/j.issn.1003-6970.2013.08.020 　　本文著录格式：[1]颜龙杰.基于近邻评分预测的协同过滤推荐算法[J].软件，2013，34（8）： 63-66 　　0 引言　　推荐系统越来越多的???用于互联网的很多行业，比如社交网站、电子商务网站、视频网站、音乐网站等等。在电子商务网站经常可以看见网站给用户推荐的一些商品，社交网站也会不时的推荐一些朋友给用户，音乐视频网站会给我们推荐一些用户可能感兴趣的音乐和视频。这些网站利用用户的一些注册信息，历史行为记录等构建各自的推荐系统。　　在互联网高速发展的时代，用户既是信息的生产者又是信息的消费者。信息的过载使得我们只可能关注于某一部分我们感兴趣的信息，推荐系统在互联网上的应用正好迎合了我们的这种需求。推荐系统主要分为：基于内容的推荐和基于用户的推荐。基于内容的推荐找出那些和用户喜欢的物品比较相似的物品推荐给用户；而基于用户的推荐则先找出那些和用户的兴趣爱好有比较大相似性的用户，然后推荐相似用户喜欢的物品给用户。评分预测协同过滤推荐是一种应用比较广泛的基于用户的推荐的算法。　　1 相关工作　　在评分预测的协同过滤推荐中认为，不同的用户评分相似性可能隐含着用户间的某种相似性，那么可以利用用户间的相似性来预测某些用户的未评分项目。评分预测利用用户已评分数据来找出与其最相似的若干用户，用这若干相似用户的项目评分数据来预测该用户的某些未评分项目。从而达到补全填充用户—项目评分数据，为用户推荐可能感兴趣项目的目的。　　用户集合为，项目集合为。用户和项目组成一个如表1的用户—项目评分矩阵。　　表1中问号表示用户还未评分，例如用户j未对项目k评分，我们就要找出与用户j最相似的若干用户，用找到的这若干用户对项目k的评分数据来预测用户j对项目k的评分。我们记用户i和用户j的相似性用sim（i，j）度量。　　传统的关于sim（i，j）的度量有很多的方法，列举以下常用两种：　　a）余弦相似性：将用户对n个项目的评分组成一个n维向量，n维向量每一个分量值为用户对项目的评分。未评分的项目对应的分量值为0。用向量间的余弦夹角度量用户间的相似性。设用户i和用户j在n维项目空间上的评分分别为向量I和向量J，则用户i和j之间的相似性sim（i，j）为：　　通过上式求得用户评分向量余弦夹角值。可知要想相似性越高，夹角需越小。　　b）相关相似性：用户i和j共同评分过的项目集合为，则用户i和j之间的相似性用Pearson相关系数度量：　　表示用户i对项目k的评分，和分别表示用户i和j对项目的平均分。　　计算项目之间的相似性可以使用计算用户之间的相似性的方法。首先得到共同评分过项目的i和j的用户集合，则项目之间的相似性sim（i，j）为　　式中表示用户u对项目i的评分，和分别表示用户对项目i和项目j的平均评分。　　2 基于近邻评分预测的协同过滤推荐算法　　传统方法在计算相似性的时候只用到两个用户共同评分的项目，当二者共同评分项目很少的时候，这样计算的用户相似性很粗糙。为此我们要增加两个用户共同评分项目的个数。　　文献[15]通过先计算项目之间的相似性，拓展用户i和j共同评过分的项目集合，然后计算用户之间的相似性从而提高计算用户之间相似性的精度。但是其在计算项目之间的相似性的时候采用的是传统的方法，这样计算出来的项目相似性还是不够精确。为了应对评分数据的稀疏，本文在计算项目之间相似性的时候引入了项目的时间信息，同时融合了项目的特征属性。　　2.1 项目特征属性相似性　　一个项目可能有一个或多个的特征属性，比如对于一部电影可能同时具有华语、动作、战争等多个特征属性。对此我们也可以抽象为如表2的项目—特征属性数据矩阵　　表中每一个项目可能有n个特征属性，1代表项目具有该特征属性，0代表不具有该特征属性。　　基于这样一个认识：如果一个特征属性被所有的项目所拥有，那么可以认为这个特征属性对项目的相似性区分不会有太大的作用。