基于用户行为分析的推荐系统研究.doc

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究意义 本课题介绍了在数据挖掘中主要常用的智能个性化推荐算法并且详细论述了协 同过滤推荐算法,并将基于用户的协同过滤算法与基于项的协同过滤算法应用于推 荐技术中,最后通过实际案例论证了协同过滤算法的可实施性。 通过本论文的研究对企业、用户具有巨大的意义: 1) 对于企业,尤其互联网企业具有巨大的意义,在营销方面,企业能够及 时获取用户的行为数据,通过算法得出用户的兴趣爱好,进而进行精确 化的推荐;在产品设计推广方面,在获取用户需求数据的基础上有针对 性的推出相应的产品,大大提升了产品的转化率。 2) 对于用户,虽然科技产品的体积屏幕越来越小,但产品越来越智能,功 能也越来越强大,更能了解用户的需求,用户在获取自身所需信息时所 付出的代价也越来越低,用户不再单单是信息的被动接受者,同时也是 信息的间接提供者。 对于科学技术和学术方面,基于数据挖掘的智能化推荐技术的发展使得下一代 人工智能、深度学习等理论领域的研究更加成熟,这也将对我们未来的生活带来深 刻的影响,相信未来越来越多的智能产品将走进人们的日常生活当中。 个性化推荐系统在国内外的研究现状 随着互联网以及移动互联网的高速发展,造成了信息的迅速膨胀,信息处于一 个严重的供大于求的状态,用户在信息的获取上所付出的代价越来越高,同时智能 化、个性化的推荐技术也是各大互联网发展的技术重点,为了提高转化率,提升用 户体验,更多的自动化、智能化、个性化推荐技术在国内外得到了快速的发展。 从智能化推荐系统的 Personal Web Watcher 的提出到基于协同过滤的智能化推 荐系统 Phoaks 和 Referral Web 的实现,商业挖掘技术和推荐技术已成为各国在理论 领域上研究的主题和在技术上寻求创新的重点[4]。较典型的有: 3 万方数据 作为全球最大的搜索引擎公司---Google 使用的推荐技术的理论原理是聚类分析, 通过用户的在网络上的行为数据,比如某个用户最常查看的网页,在网页上所花费 的时间长短,所浏览网页的深度等等,将有相似行为的用户进行聚类,进而推荐相 应的网页。或者根据用户上网所搜索的商品或服务,再根据商品和服务之间的关联 性,推荐相应的商品或服务。 Amazon.Com 是一家运用推荐系统的典型企业。Amazon.Com 应用的是常用的购 物篮数据分析方式——关联分析,即通过分析商品之间的相似性,寻找关联性较高 的商品,在用户浏览或购买一个商品时,就可以对应的向其推荐与已购商品关联性 较高的商品 [5]。然而创建商品间的相似项目表,非常耗时,影响系统的实时推荐的 速度,因此,采用离线定时分析,可以提高系统在线推荐的效率[5,6]。正是因为运用 了商品关联性进行商品推荐,Amazon.Com 在商品关联性技术上取得了巨大的成就, 而商品的转化率也高。 MovieLens 是一个能够个性化的向用户推荐电影的网站。它首先记录用户在网 站上的行为,然后将用户的行为转化为用户对电影的评分,然后利用这些评分去计 算用户之间的相似性。在向用户推荐电影时,参考与其兴趣相似性比较高的用户, 将其评分较大的电影推荐给目标用户[7]。 以上为国外在相关推荐技术方面的研究,由于技术以及经济方面的因素,国外 在相关方面的研究远远高于国内,但近年来随着国内技术的不断发展,在相关方面 的研究也取得显著的成就。 作为全国最大的电子商务网站阿里巴巴在智能推荐领域取得了显著的成绩,更 提出了“千人千面”计划[8],即根据用户以往的购物行为,基于大数据分析技术实 现在用户浏览页面时,每个用户所看到的页面都是不同的。当用户首次登陆阿里巴 巴网站时候由于没有用户的任何历史记录信息,这时候网站会将以往购买最多的商 品推荐给用户;当用户已经登陆过网站或者已经是阿里巴巴的会员,那么阿里必然 会保留用户的数据,这个时候就会根据以往的购买历史进行相应的推荐。 国内的一家音乐播放软件——豆瓣音乐(http://douban.fm/)看似随机的向用户播 放音乐,其实背后存在着基于大数据的数据挖掘过程。其非常出名的一个功能就是 4 万方数据 “豆瓣猜你会喜欢”。豆瓣的数据挖掘工程师给歌曲或专辑加上几种不同的特征: (1)类型其取值有古典、流行、摇滚嘻哈、爵士等。(2)歌手其取值有男、女、 大陆、港台、国外、组合等。通过这些属性标示,在歌曲播放的时候通过用户行为, 比如用户把歌曲标示为喜欢、不再播放、跳过、对音乐进行评分或收藏该专辑记录 用户对歌曲的喜爱程度,从而根据以上特征向用户推荐。在以上特征中由于各个特 征值的权重不同,在向用户推荐时会将特征赋予不同的权重,比如类型和语言的权 重就比较高。 在社交网络中推荐系统也得到了极大的应用,作为我们最大的社交网络——腾 讯在智能推荐技术方面也取得了很大的成绩。比

您可能关注的文档

文档评论(0)

lh2468lh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档