- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户的协同过滤推荐技术的论文.doc
基于用户的协同过滤推荐技术的论文
[摘要] 随着因特网普遍使用和电子商务迅猛发展,推荐系统已成为重要研究领域,人们对推荐技术作了广泛的研究。个性化的推荐系统以个性化方式向用户推荐商品,帮助用户找到他们所需要的商品,并便捷地完成购买过程。介绍了电子商务系统中的协同过滤推荐技术,详细分析了基于用户的协同过滤推荐算法,同时指出了它的优点和缺点。
[关键词] 电子商务 协同过滤 推荐系统 推荐技术
当前,电子商务系统迅猛发展,随之而来地出现了电子商务系统中的信息“超载”现象。海量的物品信息无疑增加了用户购买所需物品的难度,使得用户很难迅速准确地找到自己真正中意的商品。为此,许多电子商务网站引入了推荐系统,以提高用户的点击率,变网站的浏览者为购买者,提高用户购买成功率和交叉销售能力,进而提升网站的美誉度和用户对网站的忠诚度。所谓电子商务推荐系统是在了解和学习用户的需求与喜好的基础上为用户提供商品信息和建议,模拟商家向用户推荐其可能感兴趣的商品,帮助用户完成购买过程。提供个性化服务已经成为进一步提高网络内容服务质量急需解决的重要课题之一,也是未来网络内容服务的一个发展方向。目前,几乎所有著名电子商务网站,诸如亚马逊、cdno*n的用户-项目评价矩阵r,这里m是用户数,n是项目数,r=(rij),元素rij表示用户i对项目j的评价。在电子商务推荐系统中,元素rij既可表示用户是否购买商品(例如0或者1),也可表示用户对商品的偏好程度(例如评分从1到10)。
(2)生成“邻居”:通过计算所有用户对之间的相似度形成“邻居”。计算系统中目标用户与其他所有用户的相似度,以找出k个最相似用户集—“最近邻居”。k-“最近邻居”依相似度排序。
(3)产生推荐:通过加权目标用户“邻居”对目标项目的评价产生推荐。根据“最近邻居”集,可计算目标用户对项目的预测评价值,进而产生推荐。假定用户i的“最近邻居”集为si,用户i对项目x的预测评价值为pi,x,用户i和用户j的相似度为sim(i,j),用户i和用户j的平均评价值分别为,那么有:
2.相似度计算方法
计算两个用户之间相似度的方法主要有三种:余弦相似度、相关相似度以及修正的余弦相似度,分述如下:
(1)余弦相似度:每个用户的评分作为n维项目空间中的一个向量。如果某个用户没有对一个项目评价,则其默认评价值设为0。两个用户i和j之间的相似性通过计算两个向量和夹角的余弦得到,记为sim(i,j),计算公式如下:
(2)相关相似度:在余弦相似度计算中没有考虑不同用户之间评价范围的差别。相关相似度通过减去用户对项目平均评价值来克服上述缺陷。两个用户i和j之间的相似性通过计算pearson相关性得到。假定用户i和用户j共同评价的项目集合为,那么相关相似度计算公式如下:
其中:ri,x为用户i对项目j的评价值,和分别为用户i和用户j的平均评价值。
(3)修正的余弦相似度:在相关相似度计算公式中,如果同时考虑用户i和用户j的评价项目集合,那么得到修正的余弦相似度计算公式如下:
其中:ii和ij分别为用户i和用户j的评价项目集合。
3.算法优点和缺点
基于用户的协同过滤算法很容易理解,与其他众多实际应用中的推荐算法相比显示出较高的推荐精度,它具有如下一些优点:
(1)能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。
(2)共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。
(3)有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的,可以发现用户潜在的但自己尚未发现的兴趣偏好。
(4)能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度。
虽然基于用户的协同过滤作为一种典型的推荐技术有其相当的应用,但随着电子商务系统规模的不断扩大,用户空间和项目空间急剧增长,该算法也存在以下缺点:
①稀疏性:在一个大型电子商务系统中,用户涉及的信息量相当有限,用户评价项目数少于总项目数的10%,造成评价矩阵数据相当稀疏,难以找到相似用户集,导致推荐效果大大降低。
②冷开始:这个问题可看作是极端严重的稀疏性问题。一方面,它很难向新用户提供个性化推荐服务;另一方面,在这种情况下,仅有少量评价数据不可能产生精确推荐。
③扩展性:基于用户的协同过滤算法的计算量随着用户和项目的增加而急剧增加,其最坏情况下的计算复杂度为o(mn)。对于一个典型的具有成百上千万用户和项目的电子商务系统,算法将遭遇到严重的扩展性问题。
三、结论
基于用户
文档评论(0)