- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
推荐算法调研报告
1. 推荐系统概述
1.1 推荐系统定义
面对互联网上海量的信息资源, 人们往往很难从海量的信息中得到符合自身
需求的信息,从而降低了信息的使用效率,也就产生了所谓的“信息过
(Information
Overload )问题。
推荐系统的基本原理是,首先对用户的历史行为数据,如浏览、购买、评论和
打分等情况进行保存, 然后根据用户的这些使用记录挖掘用户偏好信息, 分析用
户的喜好并构建用户兴趣模型。 当用户浏览信息时, 它可为不同的用户主动推荐
其可能感兴趣的信息,提供个性化的服务,以满足不同用户的不同需求。
搜索引擎和推荐系统的本质区别是:搜索引擎需要用户手动查找信息,相当
于用户去“ Pull ”信息,用户是主动的,搜索引擎是被动的;而推荐系统自动提
供信息给用户,相当于推荐系统去“ Push”信息,推荐系统是主动的,用户是被
动的。
推荐系统有 3 个重要的模块: 用户建模模块、 推荐对象建模模块、 推荐算法
模块 。通用的推荐系统模型流程如图 1 所示
推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配, 同
时使用相应的推荐算法进行计算筛选, 找到用户可能感兴趣的推荐对象, 然后推
荐给用户。
用户模型是关于用户信息需求、兴趣、偏好和使用习惯等知识的表示模型,
为了保证用户模型的准确性和时效性, 用户建模部件还要负责收集用户的反馈信
息,实现对用户模型的实时或周期性更新。
推荐对象的描述文件中的对象特征和用户的描述文件中的兴趣偏好进行推荐
计算,获得推荐对象的推荐度, 所以推荐对象的描述文件与用户的描述文件密切
相关,通常的做法是用同样的方法来表达用户的兴趣偏好和推荐对象。
推荐算法是完成推荐的核心部件,其实现用户模型与信息对象模型之间的匹
配,对用户未访问的信息项目进行评分预测, 并依据预测评分生成相应的推荐信
息项目集合。
1.2 几种代表性的推荐系统
下面列举几个较有代表性的推荐系统:
1. Amazon 推荐系统:
Amazon 是美国最大的一家网络电子商务公司, 位于华盛顿州的西雅图, 它是
网络上最早开始经营电子商务的公司之一,成立于 1995 年, Amazon研究电子
商务的推荐系统长达 10 年时间, Amazon 利用网站系统记录的海量日志和回馈
信息等数据实现了基于协同过滤的混合推荐算法。 推荐系统从海量的数据中挖掘
用户兴趣模型, 为不同用户提供不同的个性化的推荐服务, 这在一定程度上提高
了用户的购物体验,进而也提升了自己的销售额, Amazon
的推荐系统为其提供了近 35%的商品销售额。
2. TAPESTRY:
这个协同过滤推荐系统是目前已知最早的在实际应用的推荐系统,它是由
Xerox PARC研究中心提出的,被用来过滤电子邮件。 TAPESTRY系统的运行机制
大体如下: 用户设定感兴趣的邮件类型; 用户向系统发出邮件需求; 系统给用户
提供许多相关的邮件;用户从收到的邮件中按自己的需求挑选出至少三封邮件;
系统记录用户的选择, 把其转换成用户特征; 系统依据用户特征为用户过滤邮件。
3. 奇艺推荐引擎:
2011 年奇艺推出了三套推荐引擎,这表示用户在不明确相关信息而无法进行搜
索的情况下, 依然有可能找到自己所喜欢的东西。 奇艺通过用户的记录和习惯建
立其兴趣模型,然后,根据不同用户的兴趣模型进行个性化的推荐。
4.
原创力文档


文档评论(0)