- 11
- 0
- 约5.99千字
- 约 9页
- 2018-10-13 发布于重庆
- 举报
协同过滤推荐系统冷启动问题研究.
引言
Web2.0的出现和应用极大地改变了网络用户的在线行为方式:由搜索和浏览转变为相互影响与分享[1]。网络上的选择呈指数增长,对用户来说找到有用的信息更加困难,也就是我们常说的信息过载问题。为解决这一问题,推荐系统应运而生,并在电子商务系统中大量应用,向用户推荐符合个人兴趣的书籍、电影和音乐等。协同过滤技术是最著名及常用的推荐技术之一[2]。协同过滤技术基于用户对商品的评分,能够处理非结构化的复杂对象,对推荐对象的格式没有特殊要求,因此在各种推荐系统被广泛使用。协同过滤推荐技术在应用中面临着一系列问题,冷启动问题是其中影响较大的一个。
协同过滤技术
协同过滤技术主要分为基于用户的协同过滤和基于项目的协同过滤。
基于用户(user-based)的协同过滤
该方法根据用户—项目评分数据集,利用统计技术搜寻与目标用户有相似历史偏好的一组用户,称为“邻居”。基于用户的协同过滤技术可以分为三步:
最近邻选择。使用相似度衡量方法,为目标用户u生成一组历史评分相似度较高的k个用户集合。常用的相似度衡量方法有余弦相似性、Pearson相关系数和调整余弦相似性。具体计算公式如下所示。
余弦相似性:sim(u1,u2) = cos( u1 ,
Pearson相关系数:sim(u1, u2) = i∈I (
其中I是指用户u1,u2共同评分的集合,Ru1 , Ru2 分别值用户
调整余弦相似性:sim(u1, u2) = i∈I
Ri 表示项目i
评分预测。在k个最近邻选好之后,利用加权平均等方法计算目标用户对未评分项目的预测评分。UN代表k个最近邻集合。
Ru,i = u
项目推荐。从未评分项目中选取评分最高的n个,向用户进行推荐。
基于项目(item-based)的协同过滤
与基于用户的协同过滤相比,基于项目的方法的一个优势是项目间的相似性比用户间的相似性更稳定,相似度矩阵更新频率低。该方法首先计算各项目间的相似度,通过目标用户评过分的项目,估计目标项目的评分。
在这里举例说明基于项目的协同过滤方法。
表1 user-item rating matrix
i1
i2
i3
i4
u1
3
5
?
u2
2
4
5
u3
1
3
5
u4
5
3
2
假设u1为目标用户,要预测他对项目i3的评分值。首先计算i3与u1的已评分项目的相似性。
sim( i1, i3) = 1×5+5×31+25
sim( i2, i3) = 2×4+3×54+9
然后利用加权平均法计算u1对i3的预测评分值。
Ru1,i3 = simi1,i3
研究热点
隐式信息的使用。隐式信息与评分数据这种显式信息相对应,可以根据隐式信息来推测显式信息,比如音乐电台可以通过用户听某首歌的次数来推测他的评分。
用户隐私的安全问题。很多用户出于保护隐私方面的考虑,不愿向系统提交完整准确的信息。最近几年互联网私人账户被盗事件使用户对私人信息更加谨慎。
基于信任网络的推荐系统。近年来,在线社交网络快速发展,出现了许多基于信任的推荐技术。利用社交网络探寻用户的关系网,将关系网内的其他用户喜好的事物推荐给当前用户,这种推荐往往更难获得用户的关注。
移动推荐技术。现在,手机已成为人们获取信息的重要通道。如果将其与推荐系统相结合,手机将成为移动用户娱乐和应用的重要工具。推荐技术能够使移动系统向用户提供个性化和焦点内容并限制了因信息过载而引起的负面影响。
冷启动(cold-start)问题。由于协同过滤技术主要基于用户对项目的历史评分,因此当评分资源不足时,就难以进行准确的推荐,这就是冷启动问题。
冷启动问题
研究意义
冷启动问题是协同过滤推荐算法中被广泛关注的一个经典问题,该问题一直影响传统协同过滤推荐系统的推荐质量。对于电子商务推荐系统,每天都有大量新用户访问和新项目添加。只有为新用户和新项目进行有效推荐,才能更好地为系统保留客户和挖掘潜在客户。
研究成果
目前针对冷启动间题提出了一些解决方法,主要分为两大方面,一是直接利用传统协同过滤的评分数据结合特定方法,二是新用户或新项目的内容属性信息与传统的协同过滤评分数据相结合。
不考虑内容的解决方法
随机推荐的方法。对于冷启动问题,实际应用中最简单最直观的方法是采用随机推荐的方式。这种方法是比较冒险
效果并不理想,从长期来看,随机推荐的方法的准确率不会超过50%。
平均值法。所有项目的均值,作为用户对未评价过项目的预测值,将原始评分矩阵进行填充,然后在填充后的评分矩阵上寻找目标用户的最近邻居,应用协同过滤的方法产生推荐。但是均值的方法只能说是一种被动应付的方式,新用户对项目的喜好值正好等于其他用户对此项目的平均值的概率是非常小的。
众数法。众数法是指采用用户对所有评价过的项目的评分个数最多的那个值作为
您可能关注的文档
- 医院管理精品-口腔护理技术风险防范流程.doc
- 医院管理系统计算机毕业论文.doc
- 医院管理系统住院管理子系统设计与实现.doc
- 医院管网管道安装施工工程施工组织设计方案.doc
- 医院绩效工资改革探讨结合医疗卫生机构特点社会效益经济效益并重王虎峰谈建立驱动型医院绩效管理模式.doc
- 医院绩效考核指标的设计 投稿贾碐碑.doc
- 医院绩效考核实施细则医院绩效考核具体实施办法和考评评分表设计.doc
- 医院绩效考评实施方案.doc
- 医院综合病房楼新建改建工程技术标.doc
- 医院药剂科主任竞聘演讲稿 竞聘演讲稿 书业网.doc
- 2026年康保县公安局公开招聘警务辅助工作人员备考题库附答案详解.docx
- 2026年卫生专业技术资格考前冲刺试卷(病案信息技术中级).docx
- 人教版数学七年级上册 第一章 有理数 期末复习课件(共17张).ppt
- 2026年计算机等级考试二级办公软件整合应用挑战.docx
- 人教版数学七年级上册1.2.4 绝对值课件(共17张).ppt
- 2026年专升本Linux操作系统基础管理卷.docx
- 人教部编版 六年级下册语文课件 小升初总复习专项训练-—作文复习--开头结尾 (共39张).ppt
- 人教版数学七年级上册 期末数学模拟卷(4)习题课件(共25张).ppt
- 人教版数学 七年级上册第一章 有理数期末复习——有理数的有关概念课件(共23张).ppt
- 人教版一年级下册数学摆一摆,想一想 课件(共17张).ppt
原创力文档

文档评论(0)