面向数据稀疏的协同过滤推荐算法研究.pdf

摘 要 摘 要 随着互联网的普及以及现代电子商务的快速发展,网络上的信息呈指数增 长的趋势,从而出现了所谓的“信息爆炸”和“信息过载”现象。个性化推荐 技术是解决信息过载问题的有效手段。作为当前应用最广泛的个性化推荐技术 之一,协同过滤推荐技术的核心思想是协同合作。近些年来,虽然协同过滤推 荐技术在实际应用中取得了巨大的成功,但同样面临着严峻的问题。其中,最 难解决的问题就是数据稀疏问题。 数据稀疏问题是推荐系统中用户和项目数据不断增加的必然结果,因为用 户给予评分的项目数量很有限,导致了用户评分矩阵稀疏,而协同过滤推荐算 法是根据用户的历史评分数据实现对用户的推荐。因此,数据稀疏问题成为制 约协同过滤推荐算法推荐结果准确性的一个重要因素。 本文主要研究面向数据稀疏的协同过滤推荐算法。首先,从两个角度出发 分析传统协同过滤推荐算法在数据稀疏情况下的弊端。然后,在此基础上,本 文提出了两种改进算法:融合争议度特征的协同过滤推荐算法和基于项目递归 关系的协同过滤推荐算法。最后,本文将提出的算法应用到实际的平台中以检 验其实用性。 具体研究内容如下: 1) 分析了传统的计算项目相似度方法在数据稀疏情况下计算项目相似度 不准确问题。本文从项目间的整体评分角度出发,提出了争议相似度的 概念,并将争议度特征融合到基于项目之间共同用户评分的传统相似度 算法中,进而提出了融合项目争议度特征的协同过滤推荐算法,缓解了 传统算法在稀疏数据情况下相似度计算不准确的问题。实验结果表明该 算法在数据稀疏环境下可以明显提升推荐质量。 2) 分析了现有协同过滤推荐算法在预测目标用户对于目标项目评分时导 致了数据的进一步稀疏化的原因。在此基础上,将项目间的递归关系融 入协同过滤推荐算法,利用递归的思想提出一种基于项目递归关系的协 同过滤推荐算法,基于项目递归关系的协同过滤推荐算法能够充分利用 了稀疏数据情况下用户评分信息,避免了预测目标用户对于项目评分时 数据的进一步稀疏化,实验结果表明该算法可以有效地缓解协同过滤推 荐中的数据稀疏问题。 3) 将本文提出的两种算法应用在《图书馆交互式科研管理平台》中以检验 算法的实用性。 I 摘 要 关键词:协同过滤 数据稀疏 争议度特征 争议相似度 II ABSTRACT ABSTRACT With the widespread Internet and development of E-commerce, Web has become an important way to access information. But on the other side, with the increasing web information, people have to spend much time on finding the interesting content we just need. Personalized recommendation has emerged in response to the information overload problem. Collaborative filtering (CF) is one of the most successful technologies in recomme

文档评论(0)

1亿VIP精品文档

相关文档