浅论时间因素在协同过滤推荐系统中的作用.docVIP

下载本文档

5
0
约4.64千字
约 8页
2016-10-07 发布于北京
举报
版权申诉

浅论时间因素在协同过滤推荐系统中的作用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅论时间因素在协同过滤推荐系统中的作用.doc

浅论时间因素在协同过滤推荐系统中的作用　　【摘要】作为迄今为止个性化推荐技术最成功的应用之一，协同过滤技术成了个性化推荐领域重点研究的课题，得到了研究者越来越多的关注。传统协同过滤算法并不能很好准确预测用户的兴趣随时间推移发生各种形式多变的变化。本文充分考虑了时间因素对推荐的影响，对协同过滤推荐技术进行了有益的探索和研究，引入了时间遗忘技术，将用户兴趣、时间效应有机的结合起来，改进基于用户的协同过滤算法。　　【关键词】协同过滤时间遗忘兴趣迁移　　1 引言　　随着网络的普及和网络信息量不断膨胀，面对众多的选择，用户要从中挑选出自己真正需要的东西，如同大海捞针般困难。于是为不同用户提供不同服务的推荐系统随之而生，由过去“人找信息”转变到“信息找人”[5]，以满足不同用户的个性化需求。　　作为应用最广泛最成熟的推荐技术之一的协同过滤推荐（Collaborative Filtering，CF）技术，它通过分析用户的爱好描述，寻找出具有相同兴趣的用户，根据用户之间的相似性来推荐资源，如图1所示。它是从用户的行为出发，基于相似兴趣用户之间的推荐，利用目标用户有相似喜好的邻居用户的信息进行分析挖掘进行推荐。　　与内容过滤不同，协同推荐只关注用户对对象的评价信息，对推荐对象本身并没有特殊的要求，不再以“内容的分析”为基础，而是以“人” 为决策基础。它侧重于由一群兴趣相似的人来选择推荐的对象，更能够处理难以表现的概念，能针对任何形态的信息进行推荐，并能取得很好的推荐效果。（图1）　　2 传统协同过滤　　在现实生活中，人们往往会咨询一些和自己兴趣相似的人来了解自己所遇到的不了解的问题或事物，通过他们的意见作出自己的选择或者判断。传统协同过滤就是对这个过程进行模拟，通过用户之间的历史行为判断找出和目标用户最相似的邻居，目标用户对某项目的喜好程度根据这些相似邻的兴趣进行一种预测。　　2.1 算法描述　　作为当前最成功推荐技术的协同过滤推荐技术，其基本出发点是：用户的评价信息包含了不同的兴趣信息；相似（兴趣）用户的评价将与其对一个未知对象的评价相似；可以按照兴趣对用户进行分类。这三条构成了协同过滤系统的理论基础。典型的协同过滤算法是基于用户（user-based）的，一般而言，协同过滤在推荐系统中主要包括建立用户模型、寻找最近邻居以及产生推荐三个步骤[1][3]。　　2.2 建立用户模型　　用一个m×n的用户-评价矩阵R表示用户的评分数据（如表1所示）。用户、项目数量分别通过m行、n列来代表，用户i对项目j的评分由第i行第j列的值来代表。　　用户对相应项目的兴趣用矩阵中已有的值来表示，空值则是需要预测的评价值。协同过滤技术的计算推荐过程就是根据已知值来计算空值的过程，这一计算填空过程所遵循的规则就是所应用的算法，规则与实际越吻合，推荐的效果就越好，预测计算的空值就越精确。（表1）　　2.3 寻找最近邻居　　在这一阶段，需要计算目标用户与其他用户之间的相似程度，并且找出与目标用户兴趣相似的用户集合，从而完成对目标用户最近邻居的识别。　　对于用户u，最近邻寻找阶段就是从一个按照相似度进行排序的用户集合中挑选N个用户作为“邻居”集合的过程。主要包括以下三种相似度的度量方法：　　（1）余弦相似度。将用户-评价矩阵R看做向量空间，每行看做一条向量，采用评分向量间的余弦夹角来度量用户间的相似度。用户u与用户v的相似度用来表示，则：　　（2.1）　　（2）相关相似度。相关相似度是将评分尺度进行归一化处理，但考虑到不同用户的评分尺度存在差异的问题，故用具体评分减去用户对该项的平均评分。通常采用皮尔森相关系数来计算相关相似度，其取值在0到1之间。　　（2.2）　　其中表示用户u对商品i的评分值，则代表用户u对其所有已评价商品的平均评分值，用户u与用户v共同评价过的项目集合则通过表示。　　（3）修正的余弦相似性。同相关相似度方法将评分尺度进行归一化处理一样，修正的余弦相似性也是改善不同评分尺度的缺陷问题，具体是通过减去用户对项的平均评分来实现，但在选择用户集合的时候还存在细小的差别。设集合表示用户u和v共同评过分的项，用户u和用户v评过分的项目集合分别用Iu和Iv表示，则用户u和用户v之间的相似度sim（u，v）表示为：　　（2.3）　　2.4 推荐的产生　　根据最近邻居集合寻找结果，借鉴下列公式计算出目标用户对未评价项目的预测评分值，并且选择计算出的最高值Top-N项推荐给目标用户，也就是当前通常采用的基于评分预测的Top-N推荐生成方法。集合表示目标用户u的最近邻集合，集合表示目标用户u对项目i的预测评分值，其计算公式如下：　　（2.4）