考虑项目属性的协同过滤推荐模型.docVIP

  • 4
  • 0
  • 约1.16万字
  • 约 19页
  • 2016-11-23 发布于北京
  • 举报
考虑项目属性的协同过滤推荐模型.doc

考虑项目属性的协同过滤推荐模型   摘要:   针对传统的基于用户的协同过滤(UCF)模型在相似性度量过程中没有充分考虑项目属性的问题,提出了两种考虑项目属性的协同过滤推荐模型。模型首先对用户评分相似性进行优化;然后从项目属性的角度统计用户关于不同项目的评价次数,获得优化的基于项目属性的用户相似性;最后通过自适应平衡因子协调处理两方面的相似性结果进行项目预测与推荐。实验结果表明,在不同的数据集中,新提出的模型不仅时间花费较为合理,而且评分预测准确性明显提高,平均提高了5%,从而证明了模型在改进用户相似性度量精度方面的有效性。   关键词:   推荐系统;协同过滤;评分相似性;项目属性;相似性模型   0引言   近年来,随着Web 2.0技术的日益发展与成熟,信息量的爆炸式增长成为最明显的时代特征,它在使人们生活变得丰富多彩的同时,也让人们逐渐步入了“信息过载”的时代。在浩瀚的信息海洋中,普通用户如何更快更准确地从中检索到自己感兴趣的信息是一件非常困难的事情,而且可能出现的一种结果是,花费了大量的时间却没有找到自己想要寻找的信息,即出现所谓的“资源迷向”问题。同时作为信息提供商,如何从海量的信息中获取用户的偏好特征让自己提供的信息内容脱颖而出,满足用户的个性化需求,同样是一件非常困难的事情。在这种背景下,推荐系统[1]作为建立在海量数据挖掘平台基础上的一种高级智能推手,它能够根据用户的特征、用户所处的情景信息和历史记录等,帮助信息提供商自动地为用户提供个性化的决策支持和信息推荐,从而具有巨大的应用潜力和商业空间。相关数据[2]表明,Amazon将推荐系统应用到电子商务中,通过分析用户的购买、浏览行为,预测用户可能感兴趣的商品,从而将销售额成功地提高了35%。类似的例子还有美国著名的网上零售商Overstock,采用个性化推荐方案后,公司的广告点击率是以前的两倍,伴随而来的销售增长也高达20%至30%。   推荐模型作为个性化推荐系统的核心组成部分,其性能的高低直接决定着系统性能的好坏。为了获得较好的系统性能,在不同的应用环境下涌现出了各种各样的推荐模型。根据推荐信息产生原理的不同,大致可以分为:协同过滤模型[3]、内容过滤模型[4]、网络结构模型[5]、基于规则的过滤模型[6]等。其中针对协同过滤模型的研究最为热门和深入[7-8],其原理是根据与目标用户相似的用户的兴趣来预测目标用户可能感兴趣的信息内容,并将最终的预测结果推荐给目标用户。目前,基于协同过滤的推荐模型已经广泛应用到各个领域,如社交网络、音乐视频点播、电子商务等[7],但在具体的应用中还存在一些问题,系统性能有待进一步提高。   传统的协同过滤模型主要依赖于用户关于项目的评分来度量对象之间的相似性,在相似性度量过程中却较少考虑不同对象的类别属性等特征,这在很大程度上影响了推荐系统性能。此外,对象相似性的优化同样是一个值得关注的问题,因为相似性模型本身会存在一定的缺陷。针对这些问题,本文提出了两种考虑项目属性的协同过滤推荐模型,在改进用户评分相似性的过程中,同时考虑项目属性方面的用户相似性,使得目标用户的近邻用户集合更加合理,最终提高推荐系统的性能。   1传统的协同过滤推荐模型   协同过滤推荐模型作为当前研究最为深入、应用最为广泛的个性化推荐技术,它根据收集相似对象模式的不同,通常可以分为两种:基于内存的协同过滤和基于模型的协同过滤。前者应用较为普遍,但由于在使用过程中需要将用到的所有数据装入内存,所以它并不适用于超大规模数据的环境。同时根据相似对象类型的不同,基于内存的协同过滤又可以进一步细分为基于用户的协同过滤(Userbased Collaborative Filtering,UCF),如用户间多相似度协同过滤推荐算法(Collaborative Filtering recommendation algorithm based on Users Multisimilarity,UMCF)[9];和基于项目的协同过滤(Itembased Collaborative Filtering, ICF),如基于项目属性和云填充的协同过滤推荐算法(Collaborative Filtering recommendation algorithm based on Item Attribute and cloud model filling,IACF)[10]。两者的主要区别在于,前者从用户的角度出发,采用相似度度量模型得到具有相似爱好或者兴趣的用户,该方法适用于用户数目变化不大、项目数量远多于用户的情况;而后者则从项目的角度出发,一般适用于用户数量非常多、而项目的数量相对用户数目较少的情况。与基于内存的协同过滤不同,基于模型的协同过滤[11]并不直接进

文档评论(0)

1亿VIP精品文档

相关文档