基于用户兴趣模糊聚类的协同过滤算法-北京玛格泰克科技发展有限公司.pdfVIP

基于用户兴趣模糊聚类的协同过滤算法-北京玛格泰克科技发展有限公司.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究论文 基于用户兴趣模糊聚类的协同过滤算法* 刘占兵 1 肖诗斌 1,2 1(北京信息科技大学计算机学院 北京 100101) 2(北京拓尔思信息技术股份有限公司 北京 100101) 摘要: 【目的 】解决传统协同过滤推荐算法存在的数据稀疏性、用户不同时间的兴趣被等同考虑的问题。【方 法 】提出一种基于用户兴趣模糊聚类的协同过滤算法。将用户兴趣模型分为稳定兴趣和当前兴趣, 利用用户稳 定兴趣对用户进行模糊聚类, 确定用户最近邻, 形成初始推荐集; 计算推荐列表中各个项目和用户当前兴趣的 相似度, 然后按照相似度大小排序, 生成最终推荐列表。【结果 】在数据集MovieLens 上验证本方法的推荐准确 率, 其平均绝对误差(MAE)较传统方法降低近 10%。【局限 】该算法中, 在对用户稳定兴趣建模时考虑所有的项 目类别, 没有对项目类别进行处理(如合并和删除等)。【结论 】与传统的推荐算法相比, 该方法的推荐准确度有 明显提高。 关键词: 模糊聚类 用户兴趣 相似度 协同过滤 分类号: TP393 G35 1 引 言 法不能快速发现用户的兴趣变化。聚类算法能够减小 用户相似邻居的搜索范围, 而用户兴趣建模则可以描 随着用户数据和商品数据的激增, 对数据进行有 述用户的兴趣以及变化, 因此结合聚类和用户兴趣建 效的分析和挖掘, 为用户提供个性化的推荐服务成为 模的方法对提高推荐质量有较大帮助。 许多商家关注的焦点。而在个性化推荐的过程中, 作 为主流技术的协同过滤推荐算法起着最为关键的作 2 研究背景 用。例如淘宝、京东、亚马逊、爱奇艺、豆瓣等网站 利用协同过滤技术为用户进行商品个性化推荐, 提升 针对传统协同过滤算法存在的评分矩阵稀疏、可 服务质量。虽然协同过滤在众多领域得到成功的应用, 扩展性弱、推荐精确度较低等缺点, 许多研究人员结 但是其存在的一些不足仍需要不断深入研究, 以达到 合聚类方法和兴趣建模改进协同过滤的方法。 更好的应用效果。 引入聚类算法可改善协同过滤算法的可扩展性, 提高最近邻的搜索效率[1-3] [1] 协同过滤算法通过对用户–项目评分矩阵中评分 。李涛等 提出一种基于用 数据的统计来判断用户或项目的相似性, 而相似性计 户聚类的协同过滤推荐算法: 在线时对基本用户数据 算是产生推荐集合的基础。随着用户数和项目数的不 进行预处理, 并对基本用户聚类, 离线时利用已有的 断增加, 用户–项目评分矩阵逐渐成为高维矩阵, 使得 用户聚类寻找目标用户最近邻居, 并产生推荐。王荣 相似性计算的复杂度急剧增加, 进而导致系统性能下 等[2]基于项目属性特征对项目进行聚类, 再利用用户 降。在用户–项目评分矩阵中, 用户真正给予评分的商 对项目簇的偏好对用户进行聚类以提高推荐效率。在 品项很少, 通常在 1%以下, 使得评分矩阵的数据逐渐 这些算法中, 用户只会分到一个聚类中, 不符合现实 稀疏, 从而导致推荐质量下降。此外, 协同过滤推荐算 中用户往往属于多个用户群体的情况, 严重影响推荐 通讯作者: 刘占兵, ORCID: 0000-0003-0085-0761, E-mail: zhanbingliu@126.com 。 *本文系国家自然科学基金项目“ 网页内容真实性评价研究”(项目编号和北京市发改委“异构大数据分析挖掘整合技术北京市 工程实验室创新能力建设项目”的研究成果之一。 12 现代图书情报技术

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档