网站大量收购闲置独家精品文档,联系QQ:2885784924

个性化推荐背后的生成机制.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
个性化推荐背后的生成机制 大家都记得塔吉特的案例: 2012 年,美国一名男子闯入他家附近的一家零售连锁超市塔吉特内抗议 :你们竟然给我 17岁的女儿发婴儿尿片和童车优惠券。店铺经理立刻向来者承认错误,但是该经理 并不知道这一行为是总公司运行数据挖掘和个性化推荐的结果。一个月后,这位父亲前来道歉,因 为这时他知道自己的女儿的确怀孕了。塔吉特比这位父亲知道自己女儿怀孕足足早了一个月。 塔吉特的案例是基于数据挖掘所做的用户行为分析的结果,经过分析之后,系统对用户进行了个性 化推荐,以至于他们有把握给客户提供的商品是他们所喜欢和需要的。 个性化推荐的背后原理 要了解个性化推荐,先得理解互联网挖掘和协同过滤这两个概念。 准确地说, 互联网的挖掘( WEB 挖掘)指的是,利用数据挖掘技术从互联网上的文档中及互联网 服务上自动发现并提取人们感兴趣的信息。 Web 挖掘是对现代电子商务战略的一个重要支持,尤其是 web 挖掘中的用户访问模式挖掘主要用于 对客户在网上行为的分析以及潜在的顾客信息的发现。 Web 挖掘的一个实现方法是对服务器日志、 错误信息日志和本地终端数据日志等日志文件进行分析,挖掘出用户的访问行为、访问频率和浏览 内容等信息,从而找出一定的模式和规则。 这就引出了协同过滤的概念。协同过滤是信息检索的一种技术,目标是为了帮用户在海量的互联网 信息(商品)中找出感兴趣的内容。 在电子商务的应用中,我们通常使用协同过滤技术来找出关联商品推荐。这种商品推荐方法被称为 推荐系统或个性化推荐系统。用通俗的话来说,协同过滤算法可以帮助找到和你喜好类似的那群人 ,看他们买了什么东西,然后推荐给你。 协同过滤的主要方法有以下三种: 基于用户的: 收集用户的信息属性。对于每一个用户 A ,找到和他比较接近(或者相似)的几个 用户。使用这些相似的用户对用户 A 的兴趣点进行预测,而把那些潜在的并没有被发掘出的兴趣点 推荐给用户 A 。 基于项目的: 收集项目的信息属性。对于一个用户,如果他对项目 X 有很高的兴趣,那么他很有可 能也对与 X 相似的项目有潜在的兴趣。 基于内容的: 除了用户和项目属性之外,基于内容的协同过滤还要进一步分析用户的评价内容和 反馈。比如用户 A 对项目 X 感兴趣,但是他对 X 的兴趣是 痛恨“ ”,这样就不能把他和 喜欢“ ”项目 X 的用 户归类在一起了。 找到相似点 当然,在电子商务领域,项目主要指的是商品。协同过滤推荐是基于这样的假设:如果一些用户对 一些项的评分比较相似,则和这些用户相似的其他用户对这些项的评分也比较相似,而这些用户对 于和这些项相似的其他项所做的评分也是相似的。 我们来举例说明:你在电子商城里买了电影碟片《指环王》和《星球大战》,协同过滤算法可以帮 助你找到买了类似产品的其他人。如果算法发现他们还买了《哈利 波特》,就会把《哈利· 波特》· 推荐给你。如果你买了余华的《兄弟》和《活着》、苏童的《大红灯笼》,系统找到了其他买这些 书的人,发现这些人都买了莫言的《檀香刑》,于是就会把这本书推荐给你。 当我们找到和客户 A “相似 ”的那些其他客户之后,就可以对商品列表进行排序了,越多和客户 A 相似 的客户买了商品 X ,就说明商品 X 越可能吸引客户 A 。 简单地说,我们如果认为有 1000 个客户是和客户 A “相似 ”的,那么可以把这些客户购买的历史数据 调出来按照多寡排序。如果其中有 100 个客户都购买了商品 X ,有 90 个顾客购买了商品 Y ,那么我们 会优先对客户 A 推荐商品 X ,然后再推荐商品 Y 。 大数据下的个性化推荐 推荐系统,或者称为个性化推荐系统,是建立在数据挖掘基础上的一套系统,以为顾客购物提供完 全个性化的决策支持和信息服务为目的。几乎所有的海外大型电子商务网站,包括亚马逊和 eBay , 都不同程度地使用了各种形式的推荐系统。 我们来看一个基于协同过滤规则的推荐系统实施案例。 如左下表所示, Chris 、Jenny 、Mark 和 Peter 等都

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地湖北
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档