大数据与商务智能课件推荐系统.pptx

大数据与商务智能课件推荐系统.pptx

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据挖掘:推荐系统王成(副教授)华侨大学计算机科学与技术学院

主要内容推荐系统基于内容的推荐协同过滤评测指标冷启动算法改进

推荐系统(mendersystem)根据用户的兴趣特点和购买行为,向用户推荐其感兴趣的信息和商品

背景随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战无明确需求信息过载

推荐系统vs搜索引擎推荐系统搜索引擎相同点都是一种帮助用户快速发现有用信息的工具不同点用户无需提供明确的需求;通过分析用户的历史行为主动向用户推荐信息;能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容用户主动提供准确的关键词;满足了用户有明确目的时的主动查找需求

基本任务联系用户和信息(物品)帮助用户发现对自己有价值的信息;让信息能够展现在对它感兴趣的用户面前;图:推荐系统的基本任务是联系用户和物品,解决信息过载的问题

用户行为数据数据的重要性:行为的普遍性准确性行为的成本反映兴趣的能力

主要内容推荐系统基于内容的推荐协同过滤评测指标冷启动算法改进

基于内容的推荐看过《同桌的你》,如何向我推荐其它电影?电影标签:剧情、青春、爱情

基于内容的推荐看过《同桌的你》,如何向我推荐其它电影?特征向量:(1,1,0.1,0.01,0)爱情青春动作科幻恐怖寻找相似度最高的前3部电影

基于内容的推荐使用特征提取方法得到物品的特征表示为每个客户建立兴趣库,记录其偏好推荐具有类似特征的物品给用户

基于内容的推荐相似度计算公式:为欧式距离余弦相似度

基于内容的推荐优点:无需依赖用户对物品的评价数据;没有冷启动问题;不受评分稀疏性的约束;能推荐新物品和非流行物品;推荐结果易解释;

基于内容的推荐缺点:要求提取有意义的特征(如音乐的风格流派),受到信息处理技术的限制;无法跨种类推荐;

主要内容推荐系统基于内容的推荐协同过滤评测指标冷启动算法改进

协同过滤(Collaborativefiltering)由Goldberg等于1992年提出,是目前最广泛应用的推荐技术之一基本思想:用户齐心协力,不断与网站互动,使自己的推荐列表能不断过滤掉自己不感兴趣的物品分为:基于用户的协同过滤(User-CF)基于物品的协同过滤(Item-CF)

1.研究背景及意义

近年来,随着计算机网络技术和通信技术的迅速发展,人们能获取到的信息量则一直是爆炸性的增长。电子商务的产生改变了传统的逛商店和直接与营业员讨价还价的方式,现如今人们更多的是在直接在电子商务网站上购物。互联网中单个用户浏览、判断和处理信息的能力却十分有限。为了解决以上问题,人们提出了推荐系统和个性化推荐技术来方便用户购买过程,刺激用户的购买活动,最大程度上发掘用户潜在需求本课题也是亚尔迪(厦门)科技有限公司的实际需求和项目。 个性化推荐系统流程图

主要推荐技术对比推荐方法基本思想优点缺点基于协同过滤的推荐用喜好相似、有相同购买经验的用户群体的喜好来推荐给某用户其可能感兴趣的商品数据隐式获得;不需要领域知识;随着时间推移性能提高;推荐个性化、自动化程度高稀疏问题;可扩展性问题;冷启动问题基于内容的推荐根据用户已选择的项目,提取出项目的内容特征属性,分析资源内容信息,为用户建立用户兴趣档案没有冷启动和稀疏性问题;不需要大规模用户就可以达到适度的推荐精准度;一旦得到物品的属性就能立刻推荐新物品受到信息提取技术的约束;复杂属性不好处理;提取的信息要能抽取成有意义的特征,且有良好的结构性基于关联规则的推荐统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y;用户在购买某些商品的时候有多大的可能性也会购买另外一些商品模型的建立在离线情况下进行,保证推荐算法的实时性要求;不要领域知识规则抽取难、耗时;个性化程度低;如果数据库规模很大,解空间会非常大基于知识的推荐针对某特定的领域建立特定的知识库,在某种程度是可以看成是一种推理技术,而不用建立在用户需要和偏好信息的基础上,是用知识和实例来进行推荐的能把用户需求映射到产品上;能考虑非产品属性知识库的构建困难;推荐是静态的

2.基于用户的协同过滤算法基于项目的协同过滤: 以项目与项目间的相似度为基础相似

2.基于用户的协同过滤算法基于用户的协同过滤: 以用户与用户间的相似度为基础 相似

基于用户与基于项目对比基于用户的与基于项目的协同过滤推荐算法对比?优点缺点适用范围基于用户推荐更社会化;能抓住热点与时效性较强(如新闻);只需维护用户相似性表个性化不太明显;难提供推荐解释用户较少,个性化要求不太高的场合:如新闻网站、资讯网站基于项目推

您可能关注的文档

文档评论(0)

137****2076 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档