网站大量收购闲置独家精品文档,联系QQ:2885784924

混合协同过滤算法及其在图书推荐中的应用研究.pdf

混合协同过滤算法及其在图书推荐中的应用研究.pdf

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

随着出版业的繁荣和文学的进步,图书市场呈现出图书更新速度快、覆盖领域广的

特点,这为读者提供了丰富的阅读素材,但也增加了读者挑选感兴趣图书的难度。另外,

互联网技术的发展改变了人们的阅读方式,传统的纸质阅读逐渐被便捷的线上阅读所替

代。因此,对于在线读书平台而言,如何盘活现有图书资源,为用户提供快速精准的推

荐,是当前亟待解决的问题。

协同过滤是目前应用最为广泛的推荐方法,其依据用户历史行为数据,计算相似度,

预测用户可能喜欢的物品,从而进行推荐。但其完全依赖用户历史行为数据,故存在以

下不足:用户历史行为数据稀疏带来的相似度计算不准确问题;新用户、新物品无历史

数据,无法为新加入用户提供个性化推荐服务或无法将新加入物品推荐给用户问题。因

此,在协同过滤算法的研究中,如何降低相似度计算误差、如何处理新加入的用户和物

品成为了研究热点。

本文从缓解用户历史行为数据稀疏的角度出发,首先综合利用图书语义信息和图书

评论中包含的关键词信息计算图书内容相似度。其中包括:利用知识表示ComplEx模型

表示图书知识图谱中的图书实体和关系,并计算图书间语义相似度;采用改进的

TextRank算法抽取图书关键词,并结合Word2Vec和Jaccard系数计算图书关键词相似

度;将图书语义相似度和关键词相似度进行加权,获得最终的图书内容相似度。其次,

在获得图书内容相似度的基础上,通过设置阈值筛选相似图书,预测评分空缺值,实现

对初始用户-图书评分矩阵的填充优化,最终将用户-图书评分矩阵的稀疏度由原始的

98.94%降至58.2%,极大的缓解了数据稀疏性。最后,依据优化后的用户-图书评分矩阵,

展开混合协同过滤推荐算法研究,采用前后端分离方式设计并实现图书推荐系统。实验

表明,本文所提算法与基于优化后评分矩阵的单一算法、基于优化前评分矩阵的混合算

法相比RMSE值最小,证明本文所提算法误差最小,能提供更加精确的个性化推荐服

务。图书推荐系统在运行过程中状态良好,满足预期需求。

关键词:混合协同过滤;内容相似度;评分矩阵优化;图书推荐系统

Abstract

Withtheprosperityofthepublishingindustryandtheprogressofliterature,thebook

markethasshownthecharacteristicsoffastupdatesandwidecoverage.Thisprovidesreaders

withrichreadingmaterials,butalsoincreasesthedifficultyofreadersselectingbooksofinterest.

Inaddition,thedevelopmentofInternettechnologyhaschangedthewaypeopleread,andthe

traditionalthesisreadinghasgraduallybeenreplacedbyonlinereading.Therefore,foronline

readingplatforms,howtorevitalizeexistingbookresourcesandprovideuserswithfastand

accuraterecommendationsisanurgentproblemthatneedstobesolved.

Collaborativefilteringiscurrentlythemostwidelyusedrecommendationmethod,which

calculatessimilaritybasedonuserhistoricalbehaviordata,predictsitemsthatusersmaylike,

andmakesrecommendations.However,itcompletelyreliesonuserhistoricalbehaviordata,so

ithasthe

文档评论(0)

论文资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档