基于用户模糊聚类个性化研究.docVIP

下载本文档

6
0
约4.14千字
约 9页
2018-08-30 发布于福建
举报
版权申诉

基于用户模糊聚类个性化研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于用户模糊聚类个性化研究

基于用户模糊聚类个性化研究　　摘要：推荐系统是根据用户的历史浏览记录或对项目的评分记录，自动为用户推送需要的信息，完成个性化推荐功能，是信息获取领域非常重要的技术。首先对用户进行模糊C均值聚类操作，将用户分为用户簇。将加权的欧氏距离替换传统的欧氏距离计算方法，在目标用户所在的用户簇内进行协同过滤推荐，得到Top-n推荐集，为用户完成项目推荐。实验结果表明，该方法可以提高推荐精度，减少评分误差，提高推荐质量，优化推荐效果。　　关键词：模糊聚类；推荐系统；协同过滤；加权欧氏距离　　DOIDOI：10.11907/rjdk.172225 　　中图分类号：TP301 　　文献标识码：A 文章编号：1672-7800（2018）002-0031-04 　　0 引言　　随着Web2.0的飞速发展，互联网技术日益成熟，人类进入信息超?d（Information Overload）时代。如何在爆炸的信息中获取想要的信息，是信息时代面临的最大挑战。人们通过搜索引擎找到自己感兴趣的信息[1]，但搜索引擎并不能完全满足需求，因为有时需求并不是很明确，无法通过搜索引擎搜索，于是推荐系统应运而生。通过分析用户的一些行为习惯自动给用户推荐各种信息，且推荐内容根据用户的行为变化实时更新，能够最大程度地提高用户体验，为用户带来最精准的互联网信息。　　当今的推荐技术中，协同过滤是最为成熟、应用最成功的技术。该技术主要针对用户-项目评分矩阵进行推荐[2]，但该技术有很多不足，如最典型的稀疏性问题和实时性问题。由于用户不可能对每个项目进行评分，所以当项目评分矩阵比较稀疏时，进行用户相似度计算会产生较大的误差，且在整个用户中寻找相似用户花费时间较长，从而影响推荐效率。　　本文在进行协同过滤推荐前，首先对用户进行聚类操作，通过模糊聚类算法把兴趣爱好类似的用户分到一类，即同一个簇中；针对待推荐用户所在的簇，通过协同过滤算法进行用户相似度计算，最后得到待评价项目的预测值，产生Top-N推荐[3]。聚类技术的引入可以缩小相似邻居的计算范围，从而减少推荐算法的时间。同时，本文针对聚类中距离的计算进行了改进。实验表明本文方法可以优化聚类效果，提高推荐质量。　　1 基于用户模糊聚类的协同过滤推荐　　1.1 模糊C-均值聚类（FCM）　　模糊聚类的本质就是针对对象的某些属性来构建模糊矩阵，然后通过一定的方法进行分类操作，模糊聚类算法分类比较简单且分类效果较好。　　模糊C-均值聚类（FCM）是J.C.Dunn按照E.Ruspini[4]定义的模糊划分集合的概念，从硬C-均值聚类算法推广得到的，最大的不同是在隶属度uij上乘一个权重值m[5]。FCM的数学模型如下：　　1.2 FCM在用户-项目评分矩阵中的应用　　1.2.1 用户-项目评分问题的数学模型　　将模糊聚类引入评分矩阵X中，该矩阵表示n个用户对m个项目进行评价，（xik）n表示用户i对项目k的评分，需要根据用户对各个项目的评分对用户进行聚类，将用户分为c个簇，使得同一个簇中的用户相似性最高，并且把聚类的结果通过矩阵U表示出来，其中uki表示用户i对用户簇k的隶属度。　　针对用户模糊聚类的函数为：　　式（10）中：uki表示用户i在用户簇k中的隶属程度，dki表示用户i与用户簇k的聚类中心距离（通常为欧几里德距离），ck表示用户簇k的中心点，即该簇的聚类点，m表示决定聚类结果模糊度的权重指数，一般1.25≤m≤2.5。参考国内外文献和实验，将m设为2。　　本模糊聚类的基本原理为：计算用户与各个聚类中心间的距离，通过得到的距离值计算用户和各个聚类中心的隶属度，通过比较隶属度高低，将用户分到最高的隶属度用户簇中，使同一个用户簇中的用户之间相似度最高，减少不同簇用户之间的相似度。　　所以，要求得用户-评分模糊聚类的最优值，只需找到最佳的聚类中心点ck，k∈1，c和各个用户对聚类中心的隶属度uki，i∈1，n即可。　　1.2.2 FCM聚类算法　　为了解得模糊聚类目标函数的最优值，利用模糊聚类法则，在极值的约束条件[7] ∑ck=1uki=1下，求min{Jm（U，c）}，构建拉格朗日函数，如式（11）所示：　　1.3 基于用户的协同过滤算法　　基于用户的协同过滤算法是分析其他用户观点，为目标用户产生推荐[9]，其基本思想是：如果某几个用户对项目的评分类似，则称他们为“邻居用户”，他们之间就可能会有相同的兴趣爱好，就可以把其他用户喜欢的推荐给目标用户。　　1.3.1 用户相似度　　协同过滤算法中最主要的是用户最近邻查询，本文只需在目标用户所在簇中计算出与目标用户最相近的邻居，然后进行预测评分。度量两个用户之间的相似度需要首先获得两个用