信息推荐系统的研究与设计.docVIP

下载本文档

14
0
约3.42千字
约 4页
2017-07-26 发布于广东
举报
版权申诉

信息推荐系统的研究与设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

信息推荐系统的研究与设计.doc

　　信息推荐系统的研究与设计第一章绪论 1.1 研究背景与意义当今已经进入大数据时代，每天互联网上的用户都要面临海量的数据信息。如何在海量的数据信息中发现对于用户有用的信息已经成为目前迫切需要解决的问题。为此学者们把在海量信息中发掘对用户有用信息的问题称为信息过载问题。推荐系统就是为解决信息过载问题而诞生的。在推荐系统诞生之前，用户常使用两种工具来解决信息过载问题，一种工具是用于分类的门户网站，另一种工具则是搜索引擎。首先出现的是门户网站，这类网站把用户经常浏览的网站进行分类排序，在互联网发展的初期，门户网站可以满足用户的需求。但是伴随互联网行业的高速发展，门户网站已难以满足各类用户的需要。在这种情况下出现了搜索引擎，搜索引擎可以通过用户输入的关键字等信息查找用户需要的信息，可以说搜索引擎极大程度的弥补了分类门户网站的不足，不过搜索引擎也存在着明显的漏洞，搜索引擎产生的搜索结果往往不是用户需要的结果，举例来说，输入 SVD 这个英文关键字出现的前几行信息往往是 SVD 枪械的信息，但是用户需要的信息很可能是 SVD 推荐算法的信息，造成这种现象的原因是搜索引擎不能分辨哪些是用户感兴趣的内容，搜索引擎所做的是把用户搜索相关的信息全部呈现给用户，因此发现有用信息的能力很弱。为弥补搜索引擎的漏洞，科研人员提出推荐系统这一概念。什么是推荐系统，所谓推荐系统就是构建用户与信息之间的桥梁，发掘大量信息中用户需求的信息，从而把用户希望得到的信息以推荐列表的形式推荐给用户的技术手段，不过这是用通俗的语言来解释推荐系统，显然不够严谨。推荐系统的形式化语言描述是 CS-gt;R。C 代表用户，S 代表推荐给用户的物品信息。物品信息可以是图书、电影、餐馆等等；R 代表最终推荐给用户的列表信息。推荐系统的目的就是对于任意用户，选择这样的物品子集以最小化用户效用，我们可以用如下的数学公式来描述推荐系统的效用。 ....... 1.2 国内外研究现状推荐系统的研究诞生于上世纪 90 年代，它伴随着信息量的迅猛增长而出现。第一个推荐系统领域的算法是基于邻域的协同过滤推荐算法，该算法的提出标志着推荐系统领域的兴起。起初这一算法是用于进行电子邮件的过滤，后来在 1994 年被 GroupLens研究小组用于进行新闻信息的过滤。此后学术界对于推荐系统的研究不断深入，在基于邻域信息的推荐算法基础之上，又提出很多改进的算法。下面就简要说明一下近几年国内外对于推荐系统领域的研究现状。目前推荐系统领域的最新研究进展主要分为如下几个方面。第一个方面是改进基于邻域的推荐算法。目前国内外最新进展是提出用二部图模型[10]改进之前的基于相似度计算的邻域模型。国内有尚明生等人提出一种带权二部图模型的推荐算法[2]。文中的工作主要集中在用户-物品的带权二部图的设计，边的权重就是用户对物品打的分数，随着图中资源分配的进行获得每一对用户的相似度，这一相似度的数值将被用作推荐的依据。王国霞等人研究利用节点间的社会标签信息，考察节点间的意义相似性[3]。并利用万有引力的原理计算节点间的引力，用节点间引力的大小作为节点间的权重值，把该映射方法用于基于标签的个性化推荐系统中。这种方法令用户兴趣偏好在映射所得的资源相关图上随机游走，得到在图上各节点的稳定概率。稳定概率可以衡量用户的兴趣偏好和图上各节点的亲密程度，其值高者推荐给用户。 ...... 第二章推荐系统相关技术 2.1 关于评分预测的推荐算法在推荐算法领域的研究中，大量的研究成果都集中在评分预测问题方面。所谓评分预测问题即考虑如何补全用户评分矩阵中的空缺项目。针对这一问题学者们提出很多的解决办法，比如基准预测，矩阵分解，邻域模型等。本小节下面的内容将详细的介绍这些理论的具体内容。在评分预测的研究当中关注的是用户或者物品的评分信息，但是评分信息不是由物品或者用户中的哪一个单独来决定，而是由用户和物品的交互来决定。在实际的评分过程当中用户和物品都是有偏的。举例来说，有的用户比较苛刻对于所有的物品打分都很低，但是有的用户比较宽松对于所有的物品打分都很高。同理物品的评分也会出现类似的情况，比如有的物品比较受欢迎用户给它的评分都很高，而有的物品比较冷门所以用户给它的打分都很低。在评分预测的过程中用户的评分行为可以被描述为一个评分矩阵，矩阵中的每一项就是用户对于一个物品的评分。现实情况是大多数用户的评分信息都是空缺的，也就是说评分矩阵是一个极为稀疏的矩阵。如何补全这个稀疏的矩阵就是评分预测问题所要研究的核心。对于补全矩阵研究人员提出很多的方案，但是要遵循的一条重要原则是补全后的矩阵与补全之前的矩阵相比扰动要尽可能的小。认定扰动大小的一条重要标准就是矩阵的特征值，如果补全后的矩阵其特征值与补全之前的矩阵特征值相比，相差不大则认为对该矩阵的