- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于物品的协同过滤算法itemcf-百卓
焦点科技 个性化推荐系统分析 暨推荐系统算法研究 杨昕 2013/1/5
本文的目标是分析现在业界的推荐系统,并且提出切实可行的方案,如何将推荐系统应用到实际工作中去,突破网站运营中的关键技术,为网站的用户带来更高的价值。
目录
个性化推荐系统定义 3
联系信息生产者与信息消费者,解决互联网时代信息过载的工具 3
个性化推荐系统同其他解决信息过载工具之间的区别 3
推荐系统和搜索之间的联系与区别 4
什么是好的个性化推荐系统: 4
用户满意度 5
预测准确度 5
评分预测: 6
TopN推荐 6
评分预测和TopN推荐的讨论 7
覆盖率 7
多样性 8
新颖性 8
信任度 9
实时性 10
健壮性 10
评价推荐系统 10
推荐系统的算法 11
如何利用用户行为数据进行用户推荐 12
用户行为数据特征 13
实验以及评测方式: 14
基于用户行为推荐算法选取的评测指标, 14
下面说明常用协同过滤算法以及优缺点: 15
基于用户的协同过滤算法(UserCF): 15
1:找到和用户兴趣相似的用户集合 15
实际应用UserCF-IIF算法: 17
基于物品的协同过滤算法(ItemCF) 17
基于物品的协同过滤算法的用户活跃度改进(ItemCF-IUF): 19
基于物品的协同过滤算法的物品相似度的归一化 19
UserCF和ItemCF的综合比较 20
基于用户行为数据分析的隐语义模型(latent factor model) 21
推荐系统的冷启动问题(基于内容的推荐) 22
利用用户注册信息冷启动: 23
利用物品的内容信息解决物品冷启动的问题: 25
结语: 26
个性化推荐系统定义
个性化推荐系统有很多年的历史了,但是促使个性化推荐系统真正走上历史舞台,发展成为专门的研究体系是在于互联网电子商务的出现,电子商务网站对商品推荐需求促使对个性化推荐系统研究逐步发展,逐渐成为研究体系。
个性化推荐系统的定义
个性化推荐系统是指联系信息生产者与信息消费者,解决互联网时代信息过载的工具。当用户没有明确的需求时,举个例子:你今天很无聊,想找一部电影来看看,当你打开电影下载网站时,面对100年来发行的数不胜数的电影,你会手足无措,不知道该看哪一部电影。摆在你面前的电影太多了,你需要解决的是信息过载的问题。这时候,你希望一个朋友在你身边,和你比较熟并且了解你的兴趣,可以提供你一些看电影的建议。不过,总不能时时有人麻烦朋友给你推荐,你需要的是一个自动化的工具,它可以分析你的历史兴趣,从庞大的电影库中找到几部符合你兴趣的电影供你选择。这个工具就是个性化推荐系统。
从上面的例子我们可以看出,随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走向了信息过载的时代。在这个时代,无论是信息消费者和信息生产者都面临了新的挑战,对于信息消费者来说,在大量信息中找到自己感兴趣的信息是一件非常困难的事情。同样对于信息生产者来说,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。
推荐系统就是解决这一矛盾的重要工具,推荐系统联系用户和信息,一方面帮助用户寻找自己感兴趣的信息,另一方面让信息能够展示在对它感兴趣的用户之前,实现信息生产者和信息消费者的双赢。
同其他解决信息过载工具之间的区别
其实为了解决信息过载的问题,在个性化推荐系统之前已经有研究者和工程师提出了很多方案,其中有代表性的解决方案是分类目录和搜素引擎。而这两种方案诞生了互联网的两家著名公司:雅虎和谷歌。
雅虎的分类目录是指以人工的方式把信息分类和整理,存放到相应目录下。形成分层次目录体系提供给用户使用。分类目录的存在的问题是当信息量越来越大时,目录体系也很难满足专业用户的查找信息需求。
而以谷歌为首的搜索引擎可以通过搜索关键词来查找信息来满足用户的需求。搜索引擎的问题在于搜索引擎需要用户主动提供准确的关键词来进行查找,当用户无法找到准确的描述自己需求的关键词时,搜索引擎就无能为力了。
个性化推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的内容。个性化推荐系统和搜索引擎互为补充,搜索引擎满足了用户在明确目的下的查找信息需求,而推荐系统在用户没有明确目的时帮助它们发现感兴趣的新信息。
另外推荐系统与分类目录以及搜索引擎的重大区别是推荐系统能够使得信息生产者更好的发掘物品中的长尾需求。很多时候,分类目录和搜索引擎都着重于向信息消费推介热门的信息,导致冷门的信息无人关注。反之个性化推荐系统可以基于用户喜好而不是物品热门程度提供信息,可以更好地发掘物品中的长尾需求,很多不热门的商品也可以基于个性化推荐系统提供给用户。
个性化推荐和搜索之间的联系与区别
在互联网时代,能够快速满足信息消费者需求的网站才能够取得成功。推荐系统和搜索都是帮助信息消
您可能关注的文档
- 家禽饲料加工与营养之间的相互关系-美国大豆协会.pdf
- 家鸽caveolin-1基因全长cdna的克隆序列和组织表达分析.pdf
- 家蚕幼虫全蚕粉的营养成分差异性分析-陕西农业科学.pdf
- 加速度传感器的选择.pdf
- 加速抗药性病原群体的形成.ppt
- 加强审计立项和基础工作管理-宁波财政税务局.doc
- 加拿大与澳大利亚关于鲑鱼进口措施的纠纷.pdf
- 加拿大的ccus经验积累中国的ccus机遇-二氧化碳捕集利用与封存.pdf
- 加工-无锡出入境检验检疫局.doc
- 家蚕免疫稳态调控分子的鉴定和表达模式分析.pdf
- 上海海洋大学《海洋环境分析技术》课件-21化学发光分析法.pdf
- 上海海洋大学《海洋环境分析技术》课件-20分子荧光分析法.pdf
- 上海海洋大学《海洋环境分析技术》课件-22色谱分离过程.pdf
- 上海海洋大学《海洋环境分析技术》课件-25气相色谱仪与固定液.pdf
- 上海海洋大学《海洋环境分析技术》课件-24色谱定性定量方法.pdf
- 上海海洋大学《海洋环境分析技术》课件-26气相色谱检测器.pdf
- 上海海洋大学《海洋环境分析技术》课件-29液相色谱固定相与流动相.pdf
- 上海海洋大学《海洋环境分析技术》课件-27气相色谱分离条件的选择.pdf
- 上海海洋大学《海洋环境分析技术》课件-28液相色谱仪器与类型.pdf
- 上海海洋大学《海洋环境分析技术》课件-3 原子光谱和分析光谱.pdf
文档评论(0)