一种基于标签和协同过滤的并行推荐算法.pdf

下载文档

10
0
约1.82万字
约 6页
2018-04-16 发布于重庆
举报
版权申诉
保障服务

一种基于标签和协同过滤的并行推荐算法.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于标签和协同过滤的并行推荐算法

高技术通讯2015年第25卷第3期：307～312 doi：10．3772／j．issn．1002-0470．2015．03．O“ 一种基于标签和协同过滤的并行推荐算法① 祝晓斌②蔡强白璐李海生 (北京工商大学计算机与信息工程学院北京100048) 摘要针对基于用户打分的传统协同过滤推荐算法存在准确率较低以及计算延时的问题，提出了一种基于标签与协同过滤的并行混合推荐算法。该算法通过计算标签的词频一逆文档频率(TF—IDF)值降低流行标签的权重，根据用户的历史行为预测用户对其他资源的偏好值，最后依据预测偏好值排序产生T叩一N推荐结果。对该算法的计算效率与复杂度进行了理论分析，并且通过并行编程模型M印Reduce使其得到了实现，最后在实验中进行了它与Apache软件基金会项目Mahout的协同过滤算法的对比分析。实验结果表明该算法有较高的准确性，能有效地提高推荐效率。关键词协同过滤，推荐，标签，TF—IDF，M叩Reduce 单节点的计算效率已经不能满足系统的需求，而且 O 引言对新加入的资源无法完成准确的推荐，造成算法冷启动问题。针对以上问题，文献[2]提出了一种基 web2．0的发展使人类进入了信息爆炸的时于项目评分预测的协同过滤推荐算法，它根据资源代，用户在海量数据中挖掘符合自身个性化需求的间相似性初步预测对未评分资源的评分，并采用一资源需花费较大精力，个性化推荐系统的出现可有种新颖的相似性度量方法计算目标用户的最近邻效地改变这种情况，个性化推荐系统可通过智能推居。文献[3]提出了一种基于矩阵分解模型的协同荐算法预测用户的偏好和需求，向用户推荐个性化过滤算法，它虽能提高推荐效果，但未能很好地解决信息。推荐系统目前应用较多的算法是协同过滤算数据稀疏性问。文献[4]针对单一评分相似度计算 c01．法，可以分为基于项目的协同过滤(item_based 提出了一种基于用户间多相似度的协同过滤算法， 1abo眦ive filtering，IBCF)算法和基于用户的协同过它基于用户间不同项目类型的多个评分相似度来计 coⅡaborative 滤(user_based filtering，UBCF)。基本算用户对未评分项目的预测评分。文献[5]通过对思路是先根据用户的历史行为计算资源或者用户之稀疏评分矩阵填充来提高用户相似度度量效果和系间的相似度。IBcF算法则是向用户推荐与用户历统推荐精度，算法使用最近邻算法进行推荐，分析传史购买行为最相近的前K个资源，而uBcF算法则统相似度和基于云模型的相似度方法优化后的度量是找出与用户购买行为最相近的用户推荐该用户最效果，分别为各填充方法选取最有效的相似度优化频繁的K个资源。该算法由Resniek和Lacovo在方案。 1994年提出【1 J，并迅速受到学术界和工业界的关现有的推荐算法忽视了用户、资源自身的特征，注，成为推荐系统的主流算法。随着互联网的发展，存在冷启动问题，而且基于用户评分的协同过滤算该算法由于资源的膨胀造成相似度矩阵过于稀疏，法存在准确度不高、效率低等问题。为解决上述问 ②男，1981年生，博士，讲师；研究方向：模式识别，视频分析等；联系人，E．mail：buddysm@