轻博客推荐系统与相关推荐算法研究.pdfVIP

轻博客推荐系统与相关推荐算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章绪论 个问题,推荐作为一种主动的提供给用户内容的方式,也被博客及其他互联网 产品普遍采用。 推荐分为普通推荐和个性化推荐【2]。普通推荐是指推荐给用户的内容是一样 的,不针对某个或某些用户单独推荐;个性化推荐与普通推荐是相对的概念, 它是针对某个用户或某类用户推荐个性化的内容。 个性化推荐是根据用户的历史行为(例如用户对于项目的直接评分或者用户 对于项目的访问)或者项目特点及它们之间的关系,向用户推荐其需要或者感 兴趣的内容。随着互联网的飞速发展和电子商务的壮大,网络信息内容的无限 膨胀使得用户越来越难以找到自己需要的信息,网络产品信息的丰富多样使得 用户越来越难以找到自己想购买的商品。为了解决这些问题,研究者们提出了 信息检索系统和信息过滤系统,其中个性化推荐系统是信息过滤系统之一,它 等人在美国人工智能协会上首次提出了个性化推荐系统LIRA,随后,Yahoo、IBM 等也推出了自己的个性化推荐系统。 推荐系统【3’4】的优劣在很大程度上取决于其采用的推荐算法。目前,个性化 推荐系统的算法主要有基于关联规则的推荐算法【5’6】、基于内容的推荐算法【『7】和 协同过滤哺】的推荐算法。其中协同过滤推荐算法是目前比较流行的推荐算法,也 是目前应用最成功的推荐算法,其基本思想【9,10】是:通过用户对项目的显式评分 (例如用户对于电影的评分)或者用户对于项目的隐式的行为(例如用户对于 博客的访问),找到评分相似或者行为相似的用户,这些相似的用户被认为是兴 趣相似的用户,然后通过用户的相似用户对于项目的评价情况,来预测用户对 项目的评分,从而得到用户对项目的兴趣度。 第二节国内外研究现状 Alto的研究中心的员工解决邮件过载的问题。原理是首先个人选择自己感兴趣的 邮件类型:然后发出自己需要的信息,这个需求会返回很多相关邮件;在这些 返回的邮件中选择至少三个对自己最有用的邮件;最后系统记录了每个人需要 的邮件信息,通过对于用户需求的掌握还进行邮件过滤。 随后出现的GroupLens[12】是一个新闻筛选的系统。用户对看过的内容进行 第一章绪论 评分,这个评分与用户的感兴趣之间是一种线性关系,而且假设用户的兴趣在 不同时间没有质的变化;然后系统根据用户对新闻的评分情况,预测用户对未 阅读的新闻的评分。 随着电子商务的出现,协同过滤开始用于商品的推荐,例如著名的电子商务 平台亚马逊;社交网络的出现使得协同过滤有了新的应用领域【13】,Facebook的 广告推荐就是利用了协同过滤推荐算法的一个例子。所以,推荐系统正在推广 到各个领域,相应的作为个性化推荐的重要算法的协同过滤算法,应用也越来 越广泛。博客作为当今互联网一种不可或缺的自我表达与互动的流行平台,个 性化推荐也是必不可少的,例如新浪微博中的猜你可能感兴趣的人。 第三节本文研究内容 针对轻博客自身特点,分析了各种流行的个性化推荐算法对于轻博客的适 用度,然后选择了协同过滤推荐算法作为了本文推荐系统的核心算法,然后针 对传统的协同过滤推荐算法存在的问题,本文在算法方面做了以下几个改进: 1.全面引入用户背景信息,以提高用户的相似用户的计算精度; 2.引入用户兴趣度权值函数,提高了相似用户的精度以及用户对目标项目的预测 评分的精度; 3.引入项目的客观相似度,并将项目客观相似度直接用于改进计算未知项目的预 测评分公式中。 4.另外,在轻博客推荐系统中,提出了数据的中间存储以及缓存机制,定时更新 用户的推荐,而推荐的过程离线进行,有效解决了用户的可扩展性问题。 协同过滤推荐算法一般是根据用户.项目评分矩阵来进行实验的,所以当用 户和项目增加,评分矩阵变的稀疏时,利用用户.项目评分矩阵来找到用户的最 近邻居已经变的不准确,所以本文提出了将用户的背景信息作为一项计算用户 的最近邻居的依据。用户的背景信息如性别、年龄、职业等与用户的兴趣之间 是有联系的,因此将用户的背景信息全面引入到用户.项目评分矩阵中,然后再 计算用户的最近邻居,实验表明,加入了用户背景信息的协同过滤推荐算法有 效的提高了用户的最近邻居的准确度,从而提高了推荐质量。 根据遗忘规律,遗忘在学习之后立即开始,并且遗忘的速度并不是均匀的, 而是先快后面,最后趋于某个值。从遗忘规律【14】得到启示,用户对于项目的兴

文档评论(0)

lh2468lh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档