- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
?
?
智能推荐系统研究综述①
?
?
胡 琪,朱定局,吴惠粦,巫丽红
1(华南师范大学 计算机学院,广州 510630)
2(广州国家现代农业产业科技创新中心,广州 510030)
3(广东农工商职业技术学院,广州 510507)
1 引言
互联网信息服务不断扩展,为用户提供更多的信息服务,也加快数据规模的增长.互联网数据包括用户个人信息,浏览记录、消费历史、项目属性等数据,如果不对这些数据加以利用,会极大地浪费存储资源,造成“信息过载”问题[1].推荐系统技术能够挖掘数据隐含价值,协同用户数据和项目属性捕捉客户的需求,提供个性化信息服务.让用户获取所需要的信息,从而提高数据的有效利用率.推荐系统在缓解数据过载的问题中发挥着重要作用,能够协助用户发现潜在的兴趣[2],缓解数据过量导致用户无法发现自己需要的信息.
推荐系统已经成为许多电子商务和多媒体平台的内核,个性化推荐服务能够帮助平台吸引用户的注意力,提高用户访问量.推荐系统为网络平台的发展提供源源不断的动力,其商业价值也引起工业界和学术界的关注.深度学习作为一项热门技术,已经在计算机视觉、自然语言处理等多个领域展现出无限潜力,也为推荐系统提供了新的方法[3].凭借深度学习技术的强大表征能力,学习用户和项目的隐向量表示,挖掘用户的历史行为数据、商品的多样化数据以及上下文场景信息,捕获用户潜在偏好,向用户生成更加精确的个性化推荐列表.
本文主要综述推荐系统的发展脉络,总结传统的推荐算法的优缺点,分析深度学习技术在推荐系统中的前沿应用,并且展望深度学习推荐算法未来研究方向.
2 传统推荐算法
2.1 协同过滤
协同过滤[4]是早期使用最为广泛的推荐算法,核心思想是综合用户和项目显式反馈信息,筛选出目标用户可能感兴趣的项目进行推荐.协同过滤算法主要类型可分为基于用户的协同过滤和基于物品的协同过滤,两种类型的算法都需要基于构建的用户和项目的二元共现矩阵,协同整个矩阵数据去预测用户对项目的评分.基于用户的协同过滤,需要计算用户之间的相似度,找到与目标用户类似的用户,加权求和相似用户的评分作为目标用户对项目的预测评分,对评分排序生成推荐项目列表.2003年,Amazon 团队[5]发表关于协同过滤的论文,介绍基于物品的协同过滤在商品推荐服务中的应用.该算法基于共现矩阵,找到目标用户评价高的物品,利用物品向量计算物品之间的相似度,最终将与高评分物品的类似物品作为推荐列表的结果.协同过滤算法具备可解释性,能够发掘出用户新的兴趣点,但随着用户和物品的规模增大,共现矩阵数据会变得更加稀疏,计算相似度时准确率会降低,影响算法实际效果.且推荐结果的头部效应明显,评分高的受欢迎物品会多次推荐,而评分信息少的新物品较少推荐,算法泛化能力较差.
2.2 矩阵分解
2006年,矩阵分解[6]算法在用户评分预测任务中表现出色,缩小预测评分与用户真实评分的误差.算法主要思想是通过分解共现矩阵,为用户和项目分别生成一个隐向量,使用隐向量表示用户的兴趣和项目的属性,用于挖掘用户与项目之间深层次潜在关系,从而提高预测准确性.矩阵分解算法通过使用奇异值分解(SVD)、特征根结构分解(ED)等方法分解共现矩阵分别得到用户隐向量pu和物品的隐向量qi,用户向量与项目向量间的点积为用户对项目的预测评分,物品预测值和真实值之差作为损失函数,如式(1):
其中,rui为用户u对物品i真实评分标签,pu与qi分别为用户和物品向量,pu与qi的点积作为用户u对物品i的预测评分.使用梯度下降算法训练模型,加入正则化项防止过拟合.相较于协同过滤算法,矩阵分解泛化能力更强,缓解数据稀疏问题.空间复杂度更低,只需保存用户和项目向量.矩阵分解算法分解得出的向量隐含用户信息和项目信息,但隐向量缺乏可解释性.矩阵分解仅利用用户与项目的评分信息,没有使用其他相关特征信息,损失了有用信息,且无法有效解决冷启动问题.
2.3 逻辑回归模型
协同过滤和矩阵分解算法只利用用户与项目的交互信息,而逻辑回归(logistic regression,LR)[7]模型能融合用户画像特征、物品属性、上下文信息,将特征转化为数值向量,输入到网络中训练,学习各个特征的权重,输出层预测样本为正的概率.逻辑回归模型有益于并行化计算,模型较为简单易于部署而广泛应用,但表征能力有限,没有进行多特征交叉组合,特征筛选,影响预测准确性.2017年,阿里巴巴团队[8]提出混合逻辑回归模型(mixed logistic regression,MLR),由于传统的逻辑回归模型表达能力有限,无法拟合复杂非线性表达式,MLR 模型吸收“分而治之”的思想,将特征空间分成几个区域,在每个区域训练一个线性模型,将不同区域的线性模型结果进行加权求和作为最终的输出结果.只要MLR 模型具有足
您可能关注的文档
最近下载
- 高热封强度耐135℃高温蒸煮的CPP膜及其制备方法.pdf VIP
- 物业交接表格-全.pdf VIP
- (高清版)DG∕TJ 08-2433B-2023 外墙保温一体化系统应用技术标准(现浇混凝土保温外墙).docx VIP
- GB8478-2020 铝合金门窗国家标准.pdf VIP
- 福建福州市八县市2024-2025高二上学期期中数学试卷及答案.pdf VIP
- 正确的员工考核评分表1.doc VIP
- 部编版三年级下册晋升职称无生试讲稿——22.我们奇妙的世界(1).docx VIP
- 《人工智能发展历程》课件.ppt VIP
- 十五规划PPT课件.pptx VIP
- 入党积极分子考试题库及答案.docx VIP
原创力文档


文档评论(0)