基于Slope One 算法图书系统优化.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Slope One 算法图书系统优化

基于Slope One 算法图书系统优化   摘要:Slope One算法是一种易实现,运算效率高,可扩展性好的协同过滤推荐算法,但该算法依赖大量用户对待预测项目的评分,在数据稀疏的情况下用户评分的可靠性对推荐结果的影响很大。该文首先利用LensKit工具下的Slope One算法和某在线图书网站的数据进行了图书推荐实验,分析了三个导致图书推荐效果不好的原因,然后提出了稀疏数据下的基于预测评分可靠性加权的Slope One算法优化,最后对优化后的推荐算法进行对比实验,证明改进后的图书推荐系统在内存使用率和推荐质量上均有明显提高。   关键词: 协同过滤; 图书推荐系统; Slope One算法; 算法优化; LensKit工具   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)04-0079-03   Abstract:Slope One algorithm is a collaborative filtering algorithm, which is easy to implement with high operational efficiency and good scalability. However this algorithm relies on a large number of users’ ratings to the item which should be predicted. The final rating prediction is affected a lot by the reliabilities of the users’ ratings when data is sparse. This paper firstly uses LensKit to realize Slope One algorithm based book recommendation with online book website data, and analyses three reasons that lead to ineffective recommendation result. Then it proposes a way to weight the reliabilities of the predictions to optimize Slope One algorithm when data is sparse. Finally this paper uses the same data set to validate this optimized Slope One algorithm and proves that the book recommendation system is improved on both storage usage and recommendation quality.   Key words:collaborative filtering; book recommendation system; Slope One; algorithm optimization; LensKit   1 概述   随着因特网的飞速发展,互联网上的信息总量呈现出了爆炸式的增长,用户很难在海量的数据中找到自己喜爱的图书。图书推荐系统主要通过分析大量在线读者的兴趣相似度或图书相似度,搜索当前读者可能感兴趣的图书推荐给他。传统的协同过滤推荐算法主要基于用户数据项评分矩阵,有基于用户和基于项目的两种近邻协同推荐法。Slope One算法是另一种经典的基于用户-项目评分矩阵的协同过滤算法,该算法是一个增量算法,对评分较少的用户也可以产生推荐,同时准确度比传统的基于用户或项目相似度的协同过滤算法要好[1]。该文用真实的电子图书网站数据和LensKit开源工具,利用基于加权Slope One算法进行了图书推荐实验,并分析了在LensKit对Slope One的实现中和在数据稀疏情况下的三个导致推荐效果不好的缺陷,然后提出了相应的解决方案。改进后的基于Slope One图书推荐系统不仅在推荐精度上有了明显的提高,还节省了系统内存。   2 基于加权Slope One算法的图书推荐   Slope One算法是由Daniel Lemire教授在2005年提出的一个基于数据项的协同过滤推荐算法[2],它和其他基于评分的协同过滤算法不同,不用计算数据项之间的相似度[3],而是用一种简单的线性回归模型进行预测:[f(x)=x+b]。其中常数项系数b为两个项目评分之间的平均差,用户UserB对书本BookA的评价建立在书本BookA和书本BookB的评分

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档