基于BaselineSVD主动学习算法推荐系统.docVIP

下载本文档

9
0
约5.77千字
约 10页
2018-11-15 发布于江苏
举报
版权申诉

基于BaselineSVD主动学习算法推荐系统.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于BaselineSVD主动学习算法推荐系统

基于Baseline SVD主动学习算法的推荐系统-电气论文基于Baseline SVD主动学习算法的推荐系统季芸1，胡雪蕾1，2 （1.南京理工大学，江苏南京210094；2.江苏省社会安全图像与视频理解重点实验室，江苏南京210094）摘要：推荐系统是一种解决信息过载的新型技术，为了解决推荐系统中新用户带来的冷启动问题，提出一种基于主动学习的推荐系统。主动学习方法能有效减少需要标记的样本数量，快速建立模型，在此选择将主动学习方法和Baseline SVD推荐算法结合起来，通过记录模型训练得到的预估评价的改变程度，认为改变最大的样例即是最具有信息量的样例，供新用户标记，并重新训练模型。通过与其他选择策略进行实验比较，证实了该方法确实有效解决了新用户带来的冷启动问题。关键词：推荐系统；主动学习；Baseline SVD；样例选择中图分类号：TN915.03-34 文献标识码：A 文章编号：1004-373X（2015）12-0008-04 收稿日期：2014-12-16 基金项目：江苏省社会安全图像与视频理解重点实验室（南京理工大学）开放基金项目（20920130122006）；高等学校学科创新引智计划资助（B13022） 0 引言随着信息技术和互联网的高速发展，各种互联网应用充斥着每个人的生活，得益于互联网的开放性，便利性和分布性，互联网上的信息量急剧增加。为了解决信息过载问题，推荐系统成为了继分类目录和搜索引擎之后，大数据时代的新宠。协同过滤作为一种主流的推荐系统技术[1]，在学术界和应用上都广受好评，它的主要思想是通过用户之间的联系来分享物品。协同过滤算法分成两种[2]：一种是基于记忆的协同过滤算法（Memory-based），包括ItemCF算法和UserCF算法，通过计算用户或物品之间的相似度来做推荐；另一种是基于模型的协同过滤（Model-based），基于模型的推荐算法往往结合了数据挖掘、人工智能、机器学习等诸多技术，常见的有基于聚类的推荐、基于矩阵分解的算法、Slope One[3]等，其中基于矩阵分解的算法有：SVD，Baseline SVD[4]，SVD++[5]等。在Netflix Prize推荐大赛之后，基于矩阵的推荐算法迅速崛起。推荐系统的发展受到了诸多因素的影响，其中一种便是新用户问题。推荐系统算法非常依赖历史数据，在用户新注册互联网应用之后，系统由于没有该用户的相关数据，而无法为新用户做出准确的推荐，这会大大影响互联用应用对用户的黏着性。为了解决新用户问题，常见的方案有：（1）非个性化推荐，随机推荐或者推荐热门，这种方法不够个性化，系统必须累积一定数量的数据才能启动推荐系统；（2）根据用户注册信息做出推荐，用户的注册信息往往是有限的，这样的推荐偏向粗粒度；（3）主动询问，该方法通过与用户交流，主动获取建立模型需要的相关知识，快速建立准确模型。推荐系统中，在将推荐产品呈现给用户时，一方面期望得到用户的满意度，另一方面期望能从用户的操作中学习到用户的偏好，这正是主动学习所致力的，因此将主动学习结合推荐系统是不谋而合的[6]。国外研究人员目前常用的算法是将贝叶斯理论作为样本选择策略，AM（Aspect Model）算法为基准学习器[7]。Jin 等针对模型本身不确定性的问题，提出了改进，使得用户参数向着准确的方向增长[8]。Rasoul Karimi提出一种基于矩阵分解的主动学习算法，选出预估评分最低的样本供用户选择[9]。 1 相关算法介绍 1.1 SVD算法 SVD（Singular Value Decomposition）[4]是一种基于潜语义的分析模型，它将用户和物品映射到低维的隐类别上，根据用户对物品已有的评分情况，分析用户和各个潜在类别，以及物品和各个潜在类别的关联程度，最后再反过来求解评分矩阵。设用户集U={u1，u2，…，uN}，电影集I={i1，i2，…，iM}，用R 矩阵表示用户U 对物品I 的评分矩阵，如表1所示，矩阵存在很多空洞，这种空洞的百分比很大，往往可以达到99%。式中：矩阵P 表示用户对于潜在类别的相关程度；矩阵Q 表示物品对于潜在类别的相关程度；K 的取值需要根据不同的数据进行选择。 1.2 Baseline SVD算法考虑到不同用户可能有不同的打分偏向，某些用户习惯打高分，某些用户习惯打低分，并且不同的电影也有不同的评分趋势，为了解决这个问题，将这种偏差列入公式： r-u,i=μ+ bi +