- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《推荐系统实践》读书笔记参考文献:项亮. 推荐系统实践[M]. 1. 人民邮电出版社, 2012.?好的推荐系统随着信息技术和互联网的发展,人们开始进入一个信息过载的时代,在这个时代,不管是信息的生产者,还是信息的消费者,这都将给他们带来一种困惑:对于信息生产者来说,在这大量的信息当中,如何做到将自己的信息展现给需要此信息的用户成为一件很困难的事情;对于信息消费者来说,如何从海量的信息当中获取自己需要的信息也成为了一件不易的事情。推荐系统能够解决以下问题,可以帮助信息生产者将自己的信息展现在对此信息感兴趣的用户面前,也能为用户到找自己感兴趣或需求的信息,因此,对于信息生产者和消费者来说,推荐系统能够实现双赢。什么是推荐系统?推荐系统就是根据用户的历史行为,判断用户的兴趣偏好,为用户推荐用户可能感兴趣的信息。推荐系统的任务是什么?推荐系统的任务就是联系用户和信息,一方面帮助用户找到对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者与信息生产者的双赢。推荐系统与搜索引擎的关系、异同?从某种意义上讲,对于用户来说,两者是一个互补的关系,搜索引擎帮助用户找到有明确需求的信息,而推荐系统则是帮助用户在没有明确需求的情况下找到感兴趣的新内容。相同点,它们都是帮助用户快速找到有用信息的工具。不同点是,1)推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为为用户建立模型,从而主动地给用户推荐满足他们感兴趣和需求的信息。2)使用搜索引擎时用户需要提供明确的需求。个性化推荐系统的应用个性化推荐系统的成功应用需要两个条件。第一个是存在信息过载,因为如果信息不多,那么用户就可以很容易地从信息当中找到自己需要的那部分,这样的话,就不需要个性化推荐系统了。第二个是用户大部分时候没有明确的需求,因为如果用户有明确的需求,那么用户就可以通过搜索引擎找到自己需要的信息了。广泛利用推荐系统的领域包括电子商务、电影和视频、音乐、社交网络、阅读、基于位置的服务、个性化邮件和广告等。电子商务:根据用户的浏览行为、点击行为、购买行为、商品评分等一系列历史行为,向用户推荐商品。如Amazon,淘宝。电影和视频:帮助用户在浩瀚的视频库中找到令用户感兴趣的视频,在该领域成功使用推荐系统的一家公司是Netflix,它和亚马逊是推荐系统领域最具代表性的两家公司。音乐:因为音乐的数量实在是太多,用海量来形容一点都不为过,而且在大多数时候,用户都没有明确想听的歌曲,所以个性化音乐推荐很有必要。国际上著名的有Pandora和Last.fm,国内有豆瓣。社交网络:根据用户之间的社交网络关系和用户的偏好信息向用户提供各种信息。如Facebook和Twitter。个性化阅读:互联网上的文章非常多,用户面临信息过载的问题,并且,用户很多时候只是想关注一下自己感兴趣的领域,并没有必须想看的特定的文章,所以个性化阅读需要个性化推荐系统,如Google Reader,Zite和Flipboard。基于位置的服务:比如你在一个陌生的地方,这个时候,你需要找一个餐馆吃饭,找一个宾馆休息,这个时候,你需要一个个性化推荐系统为你推荐餐馆,推荐宾馆。基于位置的服务推荐系统通常和社交网络结合在一起,这样可以通过获取社交网络里的个人信息、社交网络关系,达到个性化推荐。如Foursquare。个性化邮件:垃圾邮件过滤,优先级收件箱功能等。个性化广告:个性化广告投放和狭义个性化推荐的区别是,个性化推荐着重于帮助用户找到可能令他们感兴趣的物品,而广告推荐着重于帮助广告找到可能对他们感兴趣的用户,即前者以用户为核心,后者以广告为核心。推荐系统评测一个完整的推荐系统一般存在3个参与方:用户、物品提供商和提供推荐系统的网站。在评测一个推荐算法时,需要同时考虑三方的利益,一个好的推荐系统是能够令三方共赢的系统。为了全面评测推荐系统对三方利益的影响根据不同的角度出发,提出不同的指标,这些指标包括准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。这些指标中,有些可以离线计算,有的只有在线才能计算,有些只能通过用户调查问卷获得。离线计算步骤:1)准备数据集;2)将数据集按照一定的规则分成训练集和测试集;3)在训练集上训练用户兴趣模型,在测试集上进行预测;4)使用预先定义的指标评测预测结果。表格 1离线实验的优缺点优点缺点不需要有对实际系统的控制权无法计算商业上关心的指标不需要用户参与实验离线实验的指标与实际商业使用的指标存在差距速度快,可以测试大量算法??用户调查:可以获取用户的主观感受的指标,但是代价大。在线实验:完成离线实验和必要的用户调查后,可以上线做AB测试,AB测试是一种很常见的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组,并对不同组的用户采用不同的算法,然后通过统
您可能关注的文档
- 第四篇、前厅部其他业务管理.ppt
- 想学就学教师端使用方法详解.pptx
- 第九章 电子商务_10电子商务教学典型案例介绍.ppt
- 第五章 ansys建模.pdf
- 新宏基智慧一体化教学系统介绍20130508幻灯片.ppt
- 第五篇 交变电流-第六篇传感器.ppt
- 传输介质的种类与性能.docx
- 炼油化工的设备配置和设计问题分析.doc
- 电气设备接地与接零的一般管理规定.docx
- 中国货币和资本市场的关联性分析.docx
- 物理(云南卷)(考试版A4) .docx
- 广州花都区2024-2025学年牛津深圳版七年级英语下第三次月考模拟练习题(含答案解析).docx
- 广州花都区2024-2025学年牛津深圳版八年级英语下第三次月考模拟练习卷(含答案解析).docx
- 物理(云南卷)(考试版A4).docx
- 广州天河区2024-2025学年牛津深圳版八年级英语下第三次月考模拟练习题(含答案解析).docx
- 2024-2025学年吉林省长春市第七十二中学九年级(下)月考语文试卷(3月份).docx
- 坐标测量机试题及答案.docx
- 地形数字测绘试题及答案.docx
- 地铁服务试题库及答案.docx
- 花店与茶馆合作合同.docx
文档评论(0)