- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于评分差异度和用户偏好的协同过滤算法.doc
基于评分差异度和用户偏好的协同过滤算法
摘要:针对传统协同过滤推荐算法仅通过使用用户评分数据计算用户相似度以至于推荐精度不高的问题,提出一种改进的协同过滤推荐算法。首先,以用户评分的平均值作为分界点得出用户间的评分差异度,并将其作为权重因子计算基于评分的用户相似度;其次,依据用户项目评分和项目类别信息挖掘用户对项目类别的兴趣度以及用户项目偏好,并以此计算用户偏好相似度;然后,结合上述两种相似度加权产生用户综合相似度;最后,融合传统项目相似度和用户综合相似度进行评分预测及项目推荐。实验结果表明,相对于传统的基于用户评分的协同过滤推荐算法,所提算法在数据集下的平均绝对误差值平均降低了2.4%。该算法可在一定程度上提高推荐算法精度以及推荐质量。
关键词:协同过滤;评分差异度;类别兴趣度;用户相似度
中图分类号:TP301.6 文献标志码:A
0引言
协同过滤(Collaborative Filtering, CF)推荐算法是在推荐领域最受关注且研究应用最广泛的算法之一[1]。传统的协同过滤推荐算法主要包括基于用户的协同过滤(Userbased CF, UserCF)算法、基于产品的协同过滤(Itembased CF, ItemCF)算法和基于模型的协同过滤(Modelbased CF, ModelCF)算法[1-2]。其中:UserCF算法首先利用用户评价信息构建用户评分矩阵,采用余弦相似度、皮尔森相似度等相似度计算方法获得用户相似度矩阵;其次,以用户相似度矩阵作为数据源,结合TopN或者设定阈值方法[3-4],获取目标用户的邻居集;然后,通过与其相关联的用户评分信息,预测目标用户对未评分项目的评分,并进行最终的产品或服务推荐。
然而,随着互联网的飞速发展,在各大电子商务网站中,浏览各类信息的用户以及注册网站的用户数据量都以亿计,网站供需的产品数量规模也已经相当庞大,这些变化都给推荐系统的运行和实施带来了很大的负担;同时,也极大影响了推荐算法的复杂程度和推荐结果的质量。在协同过滤推荐算法中,数据稀疏以及相似度计算方式是影响推荐精度的重要原因[5]。为此,许多研究学者针对相似度计算方法提出了一系列的改进措施。一些学者提出项目评分预填充[6]、混合加权[7]等方式缓解数据稀疏,以改善相似度计算精度。也有一些学者,例如,高娜等[1]提出了改进的结合标签和评分的协同过滤(Unifying Tags and Ratings CF, UTRCF)推荐算法以及结合标签和评分的基于用户的协同过滤(Unifying Tags and Ratings based on user CF,UTRUserCF)推荐算法,有效缓解了数据稀疏性问题,并提升了推荐准确性;宋瑞平[8]提出了结合用户评分以及用户属性的综合相似度和改进最近邻的混合推荐算法――MSCF算法,改进了推荐算法的精确度;王晓军[9]提出了一种结合项目属性和偏好的协同过滤(CF using item Attribute and Preferences, CFAP)算法,首先利用项目基础特征和用户特征构建项目偏好,然后通过项目相似度融合提高相似度计算准确性。以上方法存在以下缺陷:在计算相似度时,未关注用户之间共同评分数对其计算精度的影响;忽略了用户评分的差异性,未考虑评分的高与低,默认所有评分的权重值相同;未充分利用项目类别信息,忽略了用户对单一项目类别的偏好程度对其评分的影响。
因此,本文综合考虑用户评分以及用户项目偏好两方面,结合用户共同评分权重、评分差异度和项目类别信息,提出一种基于评分差异度和用户偏好的协同过滤(CF based on Score Difference level and User Preference, SDUPCF)推荐算法,该算法从融合了用户共同评分权重以及评分差异度的用户评分信息和用户项目偏好信息两方面计算用户综合相似度,最终利用目标用户的相似用户对目标项目的评分以及目标项目的相似项目被用户评分结果,通过加权进行评分预测及生成推荐。
4结语
用户对项目的评价的高低可以体现用户对其的喜好程度,本文以此提出评分差异度权重因子,而用户对不同项目类别的喜好可以反映出用户对项目类别的感兴趣程度,结合用户评分可以更加准确地表示用户对项目的偏好。本文将评分差异度权重因子融入到用户评分相似度中,并利用用户项目类别兴趣度计算用户项目偏好,提出了一种新的用户相似度计算方法,并在最终预测评分阶段通过加权融合基于项目的评分值预测结果,进一步改善推荐结果。实验结果表明,本文算法在一定程度上提高了相似度计算的准确性以及推荐质量。此外,本文在算法设计以及实验过程中,发现在最近邻居选择时,忽略了与目标用户相似度很高但是未对预测项目评分的
您可能关注的文档
- 基于改进遗传算法的网络入侵检测.doc
- 基于攻击路径图的网络攻击意图识别技术研究.doc
- 基于故障传播模型与监督学习的电力通信网络故障定位.doc
- 基于教育资源共享APP界面的可用性研究.doc
- 基于数字视频技术的体育短跑多媒体CAI 课件设计与制作.doc
- 基于数字逻辑电路实现的闪光灯控制板.doc
- 基于数学建模的高职经济数学“教学做”一体化教学研究.doc
- 基于数据仓库的科研成果管理决策支持系统的研究与实现.doc
- 基于数据挖掘技术的毕业生信息管理系统的研究与开发.doc
- 基于数据挖掘的医保欺诈预警模型研究.doc
- 2024年秋季学期新冀教版物理八年级上册课件 第五章 一元一次方程 5.3.1 用移项解一元一次方程.pptx
- 2024年秋季学期新人教版七年级上册数学课件 第五章 一元一次方程 5.1.2 等式的性质(第1课时)等式的性质.pptx
- 2024年秋季学期新人教版数学一年级上册课件 第5单元 20以内的进位加法 4 解决问题 第3课时 练一练.pptx
- 2024秋新鲁教版英语六年级上册课件 Unit 2 Section A(1a-1d)(第1课时).pptx
- 2024年秋季学期新人教版数学一年级上册课件 第2单元 6~10的认识和家、减法 2 6~9的加、减法 第5课时 8和9的加、减法.pptx
- 2024年秋季学期新人教版七年级上册数学课件 第六章 几何图形初步 6.3角 6.3.3余角和补角.pptx
- 2024年秋季学期新人教版七年级上册数学课件 第五章 一元一次方程 5.3 实际问题与一元一次方程(第4课时)积分问题.pptx
- 远离诱惑专注成长班会.pptx
- 国际禁毒日主题班会和稿子.pptx
- 网络安全意识保护班会.pptx
文档评论(0)