- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户模糊聚类个性化研究
基于用户模糊聚类个性化研究
摘 要:推荐系统是根据用户的历史浏览记录或对项目的评分记录,自动为用户推送需要的信息,完成个性化推荐功能,是信息获取领域非常重要的技术。首先对用户进行模糊C均值聚类操作,将用户分为用户簇。将加权的欧氏距离替换传统的欧氏距离计算方法,在目标用户所在的用户簇内进行协同过滤推荐,得到Top-n推荐集,为用户完成项目推荐。实验结果表明,该方法可以提高推荐精度,减少评分误差,提高推荐质量,优化推荐效果。
关键词:模糊聚类;推荐系统;协同过滤;加权欧氏距离
DOIDOI:10.11907/rjdk.172225
中图分类号:TP301
文献标识码:A 文章编号:1672-7800(2018)002-0031-04
0 引言
随着Web2.0的飞速发展,互联网技术日益成熟,人类进入信息超?d(Information Overload)时代。如何在爆炸的信息中获取想要的信息,是信息时代面临的最大挑战。人们通过搜索引擎找到自己感兴趣的信息[1],但搜索引擎并不能完全满足需求,因为有时需求并不是很明确,无法通过搜索引擎搜索,于是推荐系统应运而生。通过分析用户的一些行为习惯自动给用户推荐各种信息,且推荐内容根据用户的行为变化实时更新,能够最大程度地提高用户体验,为用户带来最精准的互联网信息。
当今的推荐技术中,协同过滤是最为成熟、应用最成功的技术。该技术主要针对用户-项目评分矩阵进行推荐[2],但该技术有很多不足,如最典型的稀疏性问题和实时性问题。由于用户不可能对每个项目进行评分,所以当项目评分矩阵比较稀疏时,进行用户相似度计算会产生较大的误差,且在整个用户中寻找相似用户花费时间较长,从而影响推荐效率。
本文在进行协同过滤推荐前,首先对用户进行聚类操作,通过模糊聚类算法把兴趣爱好类似的用户分到一类,即同一个簇中;针对待推荐用户所在的簇,通过协同过滤算法进行用户相似度计算,最后得到待评价项目的预测值,产生Top-N推荐[3]。聚类技术的引入可以缩小相似邻居的计算范围,从而减少推荐算法的时间。同时,本文针对聚类中距离的计算进行了改进。实验表明本文方法可以优化聚类效果,提高推荐质量。
1 基于用户模糊聚类的协同过滤推荐
1.1 模糊C-均值聚类(FCM)
模糊聚类的本质就是针对对象的某些属性来构建模糊矩阵,然后通过一定的方法进行分类操作,模糊聚类算法分类比较简单且分类效果较好。
模糊C-均值聚类(FCM)是J.C.Dunn按照E.Ruspini[4]定义的模糊划分集合的概念,从硬C-均值聚类算法推广得到的,最大的不同是在隶属度uij上乘一个权重值m[5]。FCM的数学模型如下:
1.2 FCM在用户-项目评分矩阵中的应用
1.2.1 用户-项目评分问题的数学模型
将模糊聚类引入评分矩阵X中,该矩阵表示n个用户对m个项目进行评价,(xik)n表示用户i对项目k的评分,需要根据用户对各个项目的评分对用户进行聚类,将用户分为c个簇,使得同一个簇中的用户相似性最高,并且把聚类的结果通过矩阵U表示出来,其中uki表示用户i对用户簇k的隶属度。
针对用户模糊聚类的函数为:
式(10)中:uki表示用户i在用户簇k中的隶属程度,dki表示用户i与用户簇k的聚类中心距离(通常为欧几里德距离),ck表示用户簇k的中心点,即该簇的聚类点,m表示决定聚类结果模糊度的权重指数,一般1.25≤m≤2.5。参考国内外文献和实验,将m设为2。
本模糊聚类的基本原理为:计算用户与各个聚类中心间的距离,通过得到的距离值计算用户和各个聚类中心的隶属度,通过比较隶属度高低,将用户分到最高的隶属度用户簇中,使同一个用户簇中的用户之间相似度最高,减少不同簇用户之间的相似度。
所以,要求得用户-评分模糊聚类的最优值,只需找到最佳的聚类中心点ck,k∈1,c和各个用户对聚类中心的隶属度uki,i∈1,n即可。
1.2.2 FCM聚类算法
为了解得模糊聚类目标函数的最优值,利用模糊聚类法则,在极值的约束条件[7] ∑ck=1uki=1下,求min{Jm(U,c)},构建拉格朗日函数,如式(11)所示:
1.3 基于用户的协同过滤算法
基于用户的协同过滤算法是分析其他用户观点,为目标用户产生推荐[9],其基本思想是:如果某几个用户对项目的评分类似,则称他们为“邻居用户”,他们之间就可能会有相同的兴趣爱好,就可以把其他用户喜欢的推荐给目标用户。
1.3.1 用户相似度
协同过滤算法中最主要的是用户最近邻查询,本文只需在目标用户所在簇中计算出与目标用户最相近的邻居,然后进行预测评分。度量两个用户之间的相似度需要首先获得两个用
文档评论(0)