- 1
- 0
- 约3千字
- 约 4页
- 2026-02-09 发布于湖北
- 举报
利用评论文本数据的推荐算法研究现状文献综述
在基于评分矩阵的推荐算法中,如果将每一个用户和物品的交互评分汇总成一个矩阵,在该矩阵中会有很多的数据缺失值,这就是此类算法要面临的数据稀疏性问题。而用户评论数据不仅数据量充足,且含有丰富的情感信息。因此学者们为了解决在使用评分矩阵的推荐算法时所遇到的问题,对用户评论在推荐算法上的应用展开深入研究,试图从中挖掘用户和物品之间的关联信息,并让推荐算法表现更加出色。将研究者们在利用用户评论文本数据的推荐算法上的研究进行总结,从采用的技术方法的角度来说,可以大致分为两种。后文将介绍两种推荐算法相关的国内外研究现状。
(1)基于传统模型的推荐算法
基于传统模型的方法中经常用文本情感分析或以主题模型为基础来构建模型。Jakob等人[28]经过研究发现,利用评论文本数据可以进行观点挖掘,挖掘出来的观点经合理利用可以提升电影推荐的效果。基于这一思路,提出了三种方法提取电影相关信息作为主题,并将它们用于协同过滤。但这只是对文本显性相关信息挖掘,并没有展开深度挖掘。Blei等人[29]经研究后设计了一种由三层次的贝叶斯模型构成的潜在狄利克雷概率模型(LatentDirichletAllocation,LDA),该模型可以从语义的角度上进行文本内容的关联性计算,并找出文本内容中可成为主题的词语。Huang等人[30]通过运用LDA主题模型来描述从Yelp数据集内的评论数据中发现的潜在子主题,提升推荐的效果。Ganu等人[31]考虑到评论文本的结构和其中传达的情感信息,设计了不同于以往的基于回归的推荐方法,并证明了使用评论文本信息能更好地、个性化地预测分数。Xu等人[32]根据评论文本进行主题分析,获取用户的喜好方向,并结合新的相似度计算方法来完成后续的协同过滤推荐。
随着对评论文本逐渐深入地研究,分析文本情感、提取文本特征技术愈发成熟,开始考虑将用户评分和评论文本进行融合研究。Basilico等人[33]充分分析并整理用户和物品的属性同用户所给评分之间的关联信息,将回归分析应用于文本处理过程和学习评分预测函数,得出推荐结果。McAuley等人[34]提出的隐藏主题因素(HiddenFactorsTopics,HFT)可以利用LDA主题模型从评论文本提取主题向量,并与评分数据经隐语义模型提取出来的隐语义向量进行结合。最后,设计一个转换函数完成推荐。Li等人[35]设计了一种基于高斯模型的优化算法,可以增强商业推荐,旨在通过利用和分析用户评论和评分矩阵来发现用户在不同方面的偏好。Fan[36]等人将评论文本和用户评分作为输入数据,经过三种特征生成方法和四种机器学习模型来找到最佳预测结果。Bao等人[37]提出一种基于矩阵分解的模型TopciMF,该模型使用带偏置项的矩阵分解进行评级预测,并采用非负矩阵因子分解完成评论数据中潜在主题的建模任务。然后,在主题分布参数的基础上开始进行物品和用户潜在向量的变换过程,将评级数据中存在的隐含因子与用户评论文本数据中提取的主题进行有效合并。Diao等人[38]设计了模型JMARS,该模型可以从用户评论文本数据中提取与情感主题有关联的主题,并实行有效的方法将其与用户评分数据进行结合。Wang等人[39]思考利用协同过滤算法与其他算法结合来提升模型的推荐性能,将它与概率主题模型进行有效结合得到新的推荐模型(RatingsMeetReviews,RMR),并将它用于网上社区内进行用户推荐。
(2)基于深度学习的推荐算法
尽管基于传统模型的方法在不断改进,推荐效果上也有所提升,但是它们面对提取数据相关特征时却表现欠佳。随着深度学习的出现,提取特征的相关技术也在逐渐成熟,很多学者将深度学习融入利用评论文本数据的推荐模型中,让推荐效果得到了质的提升。
Shen等人[40]提出了一种卷积神经网络的自动学习资源推荐算法,利用(ConvolutionalNeuralNetworks,CNN)从文本内容中挖掘出潜在因子,可以进行个性化推荐。Shu等人[41]利用CNN从多媒体资源的文本信息中挖掘潜在因子,构建基于内容的推荐算法来提升推荐资源的效果。赫少华等人[42]对深度学习和自然语言处理进行了深入地研究,并把这两种技术用于教育领域的混合推荐算法上。具体流程是通过分析每一位用户和经模型分类后同类别中用户的相似度,然后将获得数值最高的相似用户推荐给用户。Kim等人[43]利用概率矩阵分解算法作为研究的底层模型,并引入卷积神经网络技术来设计了一个新的卷积矩阵分解(ConvolutionalMatrixFactorization,ConvMF),它可以精准抓取到某单词前后文不起眼的信息变化,并能缓解评分矩阵中缺失值过多的问题。Zheng等人[44]提出深度协作神经网络模
您可能关注的文档
- 2026《PS-InSAR变形监测技术的发展研究国内外文献综述》1600字.docx
- 2026《房地产价格现状及价格构成分析》1800字.docx
- 2026《中国司法实践下的证券虚假陈述判例解析》2000字.docx
- 2026《生鲜产品高铁快运的发展研究国内外文献综述》1700字.docx
- 2026《域外刑事诉讼中法官庭外调查权评析》1600字.docx
- 2026《我国房地产价格的影响因素(需求供给角度)分析》2100字.docx
- 2026《玻璃陶瓷中铬的作用概述》1400字.docx
- 2026《白酒业上市公司责任信息披露的相关建议分析》2600字.docx
- 2026《餐厨垃圾资源化利用的现状与发展文献综述》2000字.docx
- 2026《CBA优秀球队进攻战术的研究文献综述》1500字.docx
- JJG 543-2026心电图机检定规程.pdf
- 《JJG 543-2026心电图机检定规程》.pdf
- GB/T 47045-2026乘用车车载信息优先级的确定方法.pdf
- 《GB/T 12668.2-2025调速电气传动系统 第2部分:一般要求 交流调速电气传动系统额定值的规定》.pdf
- 中国国家标准 GB/T 12668.2-2025调速电气传动系统 第2部分:一般要求 交流调速电气传动系统额定值的规定.pdf
- 中国国家标准 GB/T 31487.1-2025直流融冰装置 第1部分:系统设计.pdf
- GB/T 12668.2-2025调速电气传动系统 第2部分:一般要求 交流调速电气传动系统额定值的规定.pdf
- GB/T 31487.1-2025直流融冰装置 第1部分:系统设计.pdf
- 《GB/T 31487.1-2025直流融冰装置 第1部分:系统设计》.pdf
- 《GB/T 31418-2025道路交通信号控制系统术语》.pdf
原创力文档

文档评论(0)