机器学习和数据挖掘在个性化推荐系统中的应用.pdf

机器学习和数据挖掘在个性化推荐系统中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器学习和数据挖掘在个性化推荐系统中的应用

专题 第 9 卷  第 3 期  2013 年 3 月 机器学习和数据挖掘 在个性化推荐系统中的应用 项 亮 关键词 :推荐系统 机器学习 数据挖掘 北京葫芦软件开发有限公司 个性化推荐系统 统不仅是第一个面向互联网用户 法,并没有什么特殊的地方。个 的推荐系统,而且给广大推荐系 性化推荐系统的特殊之处在于对 个性化推荐系统是一种利 统研究人员提供了真实的用户行 用户行为和用户心理的研究。所 用用户历史数据建立用户兴趣模 为数据集。从90 年代末期开始, 以,本文将介绍研究人员是如何 型、帮助用户过滤无关信息、提 推荐系统开始在大型商业网站中 将机器学习和数据挖掘算法用来 供最能满足用户个性化需求信息 得到推广,其中的代表是亚马逊 解决推荐系统中的常见问题的。 的系统。除了满足用户的需求, (Amazon)。亚马逊在 1998 年提 推荐系统也应兼顾信息提供者的 出了基于物品的协同过滤算法, 推荐系统的架构 利益,将他们的信息以最高的效 并在自己的网站中广泛应用该算 率投放给对信息感兴趣的用户。 法来帮助用户选择自己喜欢的图 目前有各式各样的个性化推 作为一种信息过滤系统,个 书。进入21 世纪,推荐系统应 荐系统,这些系统的架构大体相 性化推荐系统在近几年得到了学 用更加广泛,Netflix 在2006 年举 似,其核心模块由三部分构成(如 术界和工业界的广泛关注。这 办了Netflix Prize 大赛,吸引了 图1 所示): 与互联网的信息爆炸是分不开 很多数据挖掘和机器学习的研究 用户特征提取模块 该模 的,只有信息量超过了用户的处 人员来研究推荐算法,极大地推 块通过获取用户的历史行为以及 理能力,推荐系统才能发挥重要 动了推荐系统在学术界的研究。 其他相关信息 (年龄、性别等) 作用。这样就就不难理解为什么 目前,一些研究人员将推荐 生成用户特征。这些特征可以全 最早的推荐系统是应用在电子邮 系统看作一个独立的研究方向。 面地描述用户的兴趣。 件系统中的[1] 。在20 世纪80 年 不过如果仔细研究现有的推荐算 相关物品检索模块 该模 代,已经有研究人员研究如何利 法,可以看出这些算法都来自于 块接受用户特征,快速找到用 用用户阅读、删除邮件的历史行 传统的机器学习和数据挖掘的算 户可能感兴趣的候选物品。这 为,来帮助用户从大量的邮件 中找到最重要的邮件。到90 年 代,诞生了著名的推荐系统研究 特征提取 相关物品检索 物品排序 [2] 小组GroupLen s ,他们开发了 Movielen s 电影推荐系统。该系 图1 推荐 系统的主要模块和流程 8 第 9 卷  第3 期  2013 年 3 月 一模块往往通过信息检索的方 会在特征提取模块降维,即降低 法实现,通过 “特征—物品” 特征的维数。 的倒排索引,快速找到和用户 降维是机器学习中一个被广 相关的物品。 个性化推荐除了满足用 泛研究的领域,它是无监督学习 推荐结果排序模块 该模 户的需求,也应兼顾信 的一个重要内容。 块利用机器学习算法,通过优化 息提供者的利益,将他 第一种降维的思路是根据兴 某一指标 (比如点击率、转化率) 们的信息以最高的效率 趣将用户进行聚类。例如根据用

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档