- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业论文外文翻译-一种基于混合体裁的性化推荐算法
译文:
一种基于混合体裁的个性化推荐算法2
摘要
由于互联网上严重的信息过载问题,作为最重要的解决方案之一,推荐系统已被广泛使用于帮助用户找到更有价值的信息。然而,传统的协同过滤方法通过评级的稀疏性和冷启动达到精准推荐。在本文中,提出一种基于传统用户的混合的协同过滤方法(CGCF),也称为为一种新的基于类型的协同过滤方法(GCF)。GCF是结合用户评分项类型前对个人风格偏好采用了一种用于信息检索与数据挖掘的常用加权技术(TF-IDF)。而结合GCF和用户基础协同的动态加权滤波,我们提出了CGCF。根据在MovieLens数据集的实验,当与基于项目的协同过滤比较时,CGCF已经减少了2.2%的MAE和提高了16.9%覆盖率。当与基于用户的协同过滤进行比较时,CGCF已经减少了2.5%的MAE和提高了6.2%覆盖率。结果表明,与传统的比较所提出的方法显然提高了推荐的精度和覆盖范围。
关键字:协同过滤,TF-IDF,数据备份,用户类型分布,动态权重。
简介
近年来,电子商务系统的快速发展给人们带来了极大的方便。我们可以在室内浏览、购买和享受各种服务。然而,无数的商品使我们头晕。快速而有效的找到货物的方法成为我们的迫切愿望。随着处理信息的能力严重的过载和为个人用户提供更个性化的服务,个性化推荐系统被视为最有用的解决方案。协同过滤技术是个性化推荐系统的最受欢迎的方法。
协同过滤推荐系统[1,2]从历史行为收集用户的偏好,然后根据他们的利益,向他们推荐特定的项目。在当前推荐系统中,基于用户和项目的技术是最流行的技术。前者的技术模拟过程中,你的志同道合的朋友会介绍一个新产品给你。它会发现用户的潜在利益。另一个会推荐目标用户之前消耗的有类似的反馈信息的项目。它就像一个用户高度评价了一部名为星际的电影,一个类似评级的电影会推荐复仇者联盟。显然,这两种技术完全地依赖于排名矩阵,然而,商品的数量是巨大的,不过,一些用户可能不评论有消耗的产品。这使得协同过滤的矩阵是不够的,这带来了两个明显的问题[ 3,4 ]被称为“数据稀疏性”和“冷启动”。
降低数据稀疏性和有效解决冷启动问题的方法是当前的主要发展方向研究。最常见的方法考虑了人口统计信息来填补缺失的分数。戴[5]等人假设用户有类似的人口统计信息可能也会有类似的偏好。然而,以确保用户有类似的偏好,光有人口信息是不够详细。此外,基于资源特性的预测填充算法[ 6 ]为了填补缺失的
评级采用了加权值的邻居资源评级。而我们需要的特性是很难获得的,并且代表性的特点是难以判断的。许多聚类方法已被应用在协同过滤,如k-均值[ 7 ]和合作聚类方法[ 8,9 ]。他们可以减少由矩阵的稀疏性引起的影响,并提高预测精确。然而,这些方法将消耗不可避免的时间,是不可能提供在线服务。杰西等人表示被用户标记的标签能够强烈地反映用户的真实偏好。然而,如果标签技术被应用到为用户推荐的项目,获取标签的过程将使用户感到有负担。
为了解决没有太多的用户参与的数据备份和冷启动问题。在本文中,我们提出了一种混合的协同过滤方法命名为CGCF。它由两部分组成:一种基于体裁的协同过滤(GCF)处理新项目冷启动并为用户提供一些评级;和传统的基于用户的协同过滤算法。结合这两个部分的动态重量,提出的混合方法。
本文的其余部分组织如下:第2部分回顾了推荐系统的基本流程和相关的相似度计算方法。在第3部分中,提出了CGCF混合协同过滤方法及其形式的过滤过程。第4部分中,对MovieLens数据集的新方法与经典方法的性能进行比较。第5部分中,总结了我们的方法,并提出了我们未来的研究方向。
相关技术
基于评价矩阵,传统的协同过滤的目的是解决信息过载的问题,并帮助用户找到自己的利益。第2.1部分介绍了一个经典的推荐过程。第2.2部分回顾几个最有用的相似性计算技术。在表:1中给出了评价矩阵的一个简单样本。
表1 用户类型评分矩阵的一个例子
2.1经典推荐程序
大家都知道,经典的推荐过程中的协同过滤可以分为以下四个
步骤:
第一步骤,在用户项目评分矩阵中寻找类似的用户或项目邻居
第二步骤,使用邻居评级的加权总和来预测新项目
第三步骤,按递减顺序排序预测新项目
第四步骤,推荐根据项目的用户目标
2.2相关相似计算技术
众所周知,整个方法的最重要的部分是获得适当的用户或项目邻居。我们如何才能得到合适的邻居?传统的相似性度量方法如表2所示:
表2 传统的相似性度量方法
余弦是基于项目的协同过滤的经典方法。它将目标用户A和B作为两个评价向量,并计算向量的相似性的角度。由于余弦相似性不采取个人评价尺度成帐户,有些人喜欢标记高评级,但有些人不喜欢。因此,为了纠正预测结果,调整后的余弦使用用户的平均评价。基于线性关系的两个用户相似性度量的相关系数,
您可能关注的文档
- 核电常规岛高加热器设计与研究.docx
- 核心素养堂落地生根十二法.pptx
- 核心素养高中英语教学.pptx
- 桔贝止咳祛片营销策划案.ppt
- 桥梁工程的发展概况-毕论文外文翻译.doc
- 核心素养学生学习.pptx
- 桥林镇明因寺蔬菜高效种植范基地项目可行性研究报告.docx
- 梁式桥施工加固研究.doc
- 框架建筑构办公楼设计.docx
- 桥梁工程的发展概况毕业论文外文文献翻译.docx
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
文档评论(0)