基于用户特征和用户兴趣的推荐计算.docx

基于用户特征和用户兴趣的推荐计算.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

基于用户特征和用户兴趣的推荐计算

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

朱保华

(西安工程大学计算机科学学院,陕西西安710048)

摘要:协同过滤技术是个性化推荐系统中最经典的代表,但传统的协同过滤技术也面临着冷启动、数据稀疏性等弊端,加上协同过滤技术很少考虑用户兴趣随时间变化和用户特征等因素,导致推荐质量不尽如人意。在传统协同过滤的基础上,结合用户兴趣变化和用户特征两方面,提出一种改进算法的协同过滤技术,与传统技术相比推荐质量显著提高。

关键词:协同过滤;用户兴趣;用户特征;个性化推荐

DOI:10.11907/rjdk.143467

中图分类号:TP312

文献标识码:A文章编号:1672-7800(2014)011-0049-02

作者简介:朱保华(1987-),男,河南周口人,西安工程大学计算机科学学院硕士研究生,研究方向为个性化服务技术与应用。

0引言

随着网络技术的发展与信息的极大丰富,用户在获取自己真正需要的信息时也面临困难,因此,协同过滤技术在个性化推荐中得到了很好的应用。协同过滤技术可以根据用户的不同喜好推荐给用户不同服务,以满足用户真正的需求和兴趣。常用的推荐方法有基于内容的推荐、基于知识的推荐、协同过滤推荐以及组合推荐等[1],其中协同过滤推荐是迄今为止应用最成功的个性化推荐技术之一[2]。

假设用户在最近一段时间内对一些项目比较感兴趣,与之相似度较大的用户可能有相同兴趣,但用户兴趣不可能一直稳定不变,原有兴趣可能会随着时间而偏移。考虑到传统的协同过滤忽略了用户特征这一因素对用户相似性的影响。因此,可将用户兴趣变化和用户特征运用于传统协同过滤技术以提高推荐质量。

1时间函数与用户特征选取

1.1用户特征选取

用户特征选取包含多个方面,以下几个方面是最基本的:①用户性别。性别差异可能导致兴趣偏好不同;②年龄。把人生分为几个阶段,少年、青年、中年、老年,不同阶段的用户关注焦点各不相同,兴趣更是截然不同;③职业。职业的选取具有多样性和关联性,这里用树形结构表示职业之间的联系。

1.2用户特征对相似度的影响

(1)将职业分类描述成一个树形结构,图1中两个任意节点的长度设为1,总长度用Height表示,用户u和用户v的职业分别用职业a和职业e表示,计算出职业a和职业e的相似度为sim0(a,e)=1/3。公式(1)为职业相似性计算公式:

根据不同的年龄阶段,他们所感兴趣的内容会有所不同,这里用Age(u,v)表示一个阈值。可设定阈值为整数,假设两用户u、v,如果两用户差值大于阈值,则用户u和用户v年龄不相似,否则两用户年龄相似。将以上3个用户特征相结合,相似度simz(u,v)可用公式(3)表示:

x、y、z分别表示职业、性别、年龄的权重系数,剩余的其它用户特征这里不再阐述,调整这3个系数可以达到不同的推荐效果。(2)用户相似性计算。将用户的3个特征值加入到传统的协同过滤中,计算用户相似性公式如下:

1.3时间函数传统的协同过滤一般考虑用户对项目的评分、项目属性或项目相似性,但是它忽略了用户兴趣不可能一直稳定不变,没有将时间这一重要因素考虑在内。用户兴趣会随着时间推移而不断变化,最近一段时间才能代表用户的即时兴趣。由于人的遗忘规律由快到慢,时间越长,其兴趣度越小。另外,根据心理学家艾宾浩斯原理,人的遗忘规律并非按时间均匀变化[3-5],而是一个逐步的、非线性过程。在最近时间段内的评分也可代表用户的最近兴趣,由这个规律构建兴趣随时间变化的时间函数

其中Dui代表用户当前访问项目的时间与最近一次访问项目的时间差值,Lu代表系统的时间跨度,即该用户最早访问某资源时间与最近访问某资源的时间差值,a∈(0,1)是权重系数。

1.4推荐

在传统协同过滤的基础上,在预测评分公式中,用户兴趣随时间变化而发生改变,将用户特征和时间函数考虑在内,预测评分公式如下:

2实验结果及分析

数据来自于MovieLens用户提供的电影评分数据,该数据集中包括了943名用户对1682部电影项目的100000条评分,评分范围在1~5分之间。用户的基本信息包括年龄、性别、职业,这些数据中用80%作为训练集,20%作为测试集。用平均误差(简称MAE)评价预测值与实际值之间的偏差,偏差越小,推荐质量越高。pi表示用户预测评分,qi表示用户实际评分,平均误差公式如下[来自www.lW5u.Com]:

邻居数(即兴趣相投、拥有共同经验的群体)范围为5~40,由图2可以看出,MAE越小,推荐精度越高。将用户特征和时间因素加入到传统的协同过滤中,相比单纯的协同过滤,推荐精度有着明显提高。原因在于传统的协同过滤忽略了用户特征对用户相似性以及兴趣度随时间因素变化的影响。因此,将用户特征和时间函数加

文档评论(0)

189****4123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档