大数据分析方法与应用 课件 第5、6章 推荐算法、 文本挖掘.pptx

大数据分析方法与应用 课件 第5、6章 推荐算法、 文本挖掘.pptx

  1. 1、本文档共134页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;5.1协同过滤推荐算法;;基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜好(如商品购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。

根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系,在有相同喜好的用户间进行商品推荐。;在示例中,5个用户分别对2件商品进行了评分(这里的分值可能表示真实的购买,也可以是用户对商品不同行为的量化指标)。如表5-1所示。;2)皮尔逊相关度评价;;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.1协同过滤推荐算法;5.2协同过滤算法常见的问题以及对策

;5.2协同过滤算法常见的问题以及对策

;4)利用物品的内容信息,userCF算法需要解决第一推动力的问题,第一个用户从哪里发现新物品。考虑利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户。对于itemCF,只能利用物品的内容信息计算物品的相关程度。基本思路就是将物品转换为关键词向量,通过计算向量之间的相似度(如余弦相似度),得到物品的相关程度。

5)采用专家标注,针对很多系统在建立的时候,既没有用户的行为数据,也没有充足的物品内容信息来计算物品相似度,这时就需要利用专家标注。

6)利用用户在其他地方已经沉淀的数据进行冷启动,比如引导用户通过社交网络账号登录,一方面降低注册成本提高转化率,另一方面获取用户的社交网络信息,解决冷启动问题。

7)利用用户的手机等兴趣偏好进行冷启动:Android手机开放度比较高,所以在安装自己的app时,就可以顺路了解下手机上还安装了什么其他的app。然后可以总结用户的特点和类型。;5.2协同过滤算法常见的问题以及对策

;5.2协同过滤算法常见的问题以及对策

;5.2协同过滤算法常见的问题以及对策

;5.2协同过滤算法常见的问题以及对策

;5.3基于内容??推荐算法

;5.3基于内容的推荐算法

;5.3.1基于结构化内容的推荐;5.3.1基于结构化内容的推荐;5.3.1基于结构化内容的推荐;5.3.2基于非结构化内容的推荐;5.3.2基于非结构化内容的推荐;5.4基于模型的推荐算法

;5.5基于关联规则的推荐算法

;5.6信息隐私与基于隐私保护的方案推荐方法

;5.6信息隐私与基于隐私保护的方案推荐方法

;5.6信息隐私与基于隐私保护的方案推荐方法

;步骤;5.6信息隐私与基于隐私保护的方案推荐方法

;5.7信息污染与信任推荐算法

;5.7信息污染与信任推荐算法

;5.7信息污染与信任推荐算法

;5.8信息茧房

;5.8信息茧房

;5.8信息茧房

;5.8信息茧房

;课后习题

;5.现有一份用户-电影评分数据集,其中包含多个用户对于不同电影的评分。你需要使用这个数据集来构建一个协同过滤算法,并为一个新用户生成推荐列表。数据集示例:;Thankyou!;;6.1文本挖掘的应用价值;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;Thankyou!

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档