轻博客推荐系统与相关推荐算法研究.pdfVIP

下载本文档

1
0
约5.31万字
约 61页
2019-07-21 发布于江苏
举报
版权申诉

轻博客推荐系统与相关推荐算法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章绪论个问题，推荐作为一种主动的提供给用户内容的方式，也被博客及其他互联网产品普遍采用。推荐分为普通推荐和个性化推荐【2]。普通推荐是指推荐给用户的内容是一样的，不针对某个或某些用户单独推荐；个性化推荐与普通推荐是相对的概念，它是针对某个用户或某类用户推荐个性化的内容。个性化推荐是根据用户的历史行为(例如用户对于项目的直接评分或者用户对于项目的访问)或者项目特点及它们之间的关系，向用户推荐其需要或者感兴趣的内容。随着互联网的飞速发展和电子商务的壮大，网络信息内容的无限膨胀使得用户越来越难以找到自己需要的信息，网络产品信息的丰富多样使得用户越来越难以找到自己想购买的商品。为了解决这些问题，研究者们提出了信息检索系统和信息过滤系统，其中个性化推荐系统是信息过滤系统之一，它等人在美国人工智能协会上首次提出了个性化推荐系统LIRA，随后，Yahoo、IBM 等也推出了自己的个性化推荐系统。推荐系统【3’4】的优劣在很大程度上取决于其采用的推荐算法。目前，个性化推荐系统的算法主要有基于关联规则的推荐算法【5’6】、基于内容的推荐算法【『7】和协同过滤哺】的推荐算法。其中协同过滤推荐算法是目前比较流行的推荐算法，也是目前应用最成功的推荐算法，其基本思想【9,10】是：通过用户对项目的显式评分 (例如用户对于电影的评分)或者用户对于项目的隐式的行为(例如用户对于博客的访问)，找到评分相似或者行为相似的用户，这些相似的用户被认为是兴趣相似的用户，然后通过用户的相似用户对于项目的评价情况，来预测用户对项目的评分，从而得到用户对项目的兴趣度。第二节国内外研究现状 Alto的研究中心的员工解决邮件过载的问题。原理是首先个人选择自己感兴趣的邮件类型：然后发出自己需要的信息，这个需求会返回很多相关邮件；在这些返回的邮件中选择至少三个对自己最有用的邮件；最后系统记录了每个人需要的邮件信息，通过对于用户需求的掌握还进行邮件过滤。随后出现的GroupLens[12】是一个新闻筛选的系统。用户对看过的内容进行第一章绪论评分，这个评分与用户的感兴趣之间是一种线性关系，而且假设用户的兴趣在不同时间没有质的变化；然后系统根据用户对新闻的评分情况，预测用户对未阅读的新闻的评分。随着电子商务的出现，协同过滤开始用于商品的推荐，例如著名的电子商务平台亚马逊；社交网络的出现使得协同过滤有了新的应用领域【13】，Facebook的广告推荐就是利用了协同过滤推荐算法的一个例子。所以，推荐系统正在推广到各个领域，相应的作为个性化推荐的重要算法的协同过滤算法，应用也越来越广泛。博客作为当今互联网一种不可或缺的自我表达与互动的流行平台，个性化推荐也是必不可少的，例如新浪微博中的猜你可能感兴趣的人。第三节本文研究内容针对轻博客自身特点，分析了各种流行的个性化推荐算法对于轻博客的适用度，然后选择了协同过滤推荐算法作为了本文推荐系统的核心算法，然后针对传统的协同过滤推荐算法存在的问题，本文在算法方面做了以下几个改进： 1．全面引入用户背景信息，以提高用户的相似用户的计算精度； 2．引入用户兴趣度权值函数，提高了相似用户的精度以及用户对目标项目的预测评分的精度； 3．引入项目的客观相似度，并将项目客观相似度直接用于改进计算未知项目的预测评分公式中。 4．另外，在轻博客推荐系统中，提出了数据的中间存储以及缓存机制，定时更新用户的推荐，而推荐的过程离线进行，有效解决了用户的可扩展性问题。协同过滤推荐算法一般是根据用户．项目评分矩阵来进行实验的，所以当用户和项目增加，评分矩阵变的稀疏时，利用用户．项目评分矩阵来找到用户的最近邻居已经变的不准确，所以本文提出了将用户的背景信息作为一项计算用户的最近邻居的依据。用户的背景信息如性别、年龄、职业等与用户的兴趣之间是有联系的，因此将用户的背景信息全面引入到用户．项目评分矩阵中，然后再计算用户的最近邻居，实验表明，加入了用户背景信息的协同过滤推荐算法有效的提高了用户的最近邻居的准确度，从而提高了推荐质量。根据遗忘规律，遗忘在学习之后立即开始，并且遗忘的速度并不是均匀的，而是先快后面，最后趋于某个值。从遗忘规律【14】得到启示，用户对于项目的兴