网站大量收购独家精品文档,联系QQ:2885784924

一种基于标签和协同过滤的并行推荐算法.pdf

一种基于标签和协同过滤的并行推荐算法.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于标签和协同过滤的并行推荐算法

高技术通讯2015年第25卷第3期:307~312 doi:10.3772/j.issn.1002-0470.2015.03.O“ 一种基于标签和协同过滤的并行推荐算法① 祝晓斌②蔡强 白璐李海生 (北京工商大学计算机与信息工程学院 北京100048) 摘要针对基于用户打分的传统协同过滤推荐算法存在准确率较低以及计算延时的问 题,提出了一种基于标签与协同过滤的并行混合推荐算法。该算法通过计算标签的词频一 逆文档频率(TF—IDF)值降低流行标签的权重,根据用户的历史行为预测用户对其他资源 的偏好值,最后依据预测偏好值排序产生T叩一N推荐结果。对该算法的计算效率与复杂 度进行了理论分析,并且通过并行编程模型M印Reduce使其得到了实现,最后在实验中 进行了它与Apache软件基金会项目Mahout的协同过滤算法的对比分析。实验结果表明 该算法有较高的准确性,能有效地提高推荐效率。 关键词 协同过滤,推荐,标签,TF—IDF,M叩Reduce 单节点的计算效率已经不能满足系统的需求,而且 O 引言 对新加入的资源无法完成准确的推荐,造成算法冷 启动问题。针对以上问题,文献[2]提出了一种基 web2.0的发展使人类进入了信息爆炸的时 于项目评分预测的协同过滤推荐算法,它根据资源 代,用户在海量数据中挖掘符合自身个性化需求的 间相似性初步预测对未评分资源的评分,并采用一 资源需花费较大精力,个性化推荐系统的出现可有 种新颖的相似性度量方法计算目标用户的最近邻 效地改变这种情况,个性化推荐系统可通过智能推 居。文献[3]提出了一种基于矩阵分解模型的协同 荐算法预测用户的偏好和需求,向用户推荐个性化 过滤算法,它虽能提高推荐效果,但未能很好地解决 信息。推荐系统目前应用较多的算法是协同过滤算 数据稀疏性问。文献[4]针对单一评分相似度计算 c01. 法,可以分为基于项目的协同过滤(item_based 提出了一种基于用户间多相似度的协同过滤算法, 1abo眦ive filtering,IBCF)算法和基于用户的协同过 它基于用户间不同项目类型的多个评分相似度来计 coⅡaborative 滤(user_based filtering,UBCF)。基本算用户对未评分项目的预测评分。文献[5]通过对 思路是先根据用户的历史行为计算资源或者用户之 稀疏评分矩阵填充来提高用户相似度度量效果和系 间的相似度。IBcF算法则是向用户推荐与用户历统推荐精度,算法使用最近邻算法进行推荐,分析传 史购买行为最相近的前K个资源,而uBcF算法则统相似度和基于云模型的相似度方法优化后的度量 是找出与用户购买行为最相近的用户推荐该用户最 效果,分别为各填充方法选取最有效的相似度优化 频繁的K个资源。该算法由Resniek和Lacovo在方案。 1994年提出【1 J,并迅速受到学术界和工业界的关 现有的推荐算法忽视了用户、资源自身的特征, 注,成为推荐系统的主流算法。随着互联网的发展, 存在冷启动问题,而且基于用户评分的协同过滤算 该算法由于资源的膨胀造成相似度矩阵过于稀疏, 法存在准确度不高、效率低等问题。为解决上述问 ②男,1981年生,博士,讲师;研究方向:模式识别,视频分析等;联系人,E.mail:buddysm@

文档评论(0)

almm118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档