Python数据分析与挖掘实战 第10章 电视产品个性化推荐.pptVIP

  • 233
  • 0
  • 约9.36千字
  • 约 56页
  • 2022-06-28 发布于甘肃
  • 举报

Python数据分析与挖掘实战 第10章 电视产品个性化推荐.ppt

贡献度分析又称帕累托分析,它的原理是帕累托法则又称“二八定律”。同样的投入放在不同的地方会产生不同的效益。例如,对一个公司而言,80%的利润常常来自于20%最畅销的产品,而其他80%的产品只产生了20%的利润。对所有收视频道名称的观看时长与观看次数进行贡献度分析。 数据探索 3. 贡献度分析 由图可知,所有收视频道名称的观看时长与观看次数分布图可以看出,随着观看各频道次数增多,观看时长也在随之增多,且后面近28%的频道带来了80%的观看时长贡献度(稍有偏差,但属性明显)。 数据探索 其中排名前15的频道名称为翡翠台、中央3台、中央新闻、广东体育、中央8台、CCTV5+体育赛事、广东珠江、广东南方卫视、江苏卫视、中央6台、凤凰中文、中央4台、广州电视、中央1台、中央5台。 数据探索 一般情况下,属性构造是经过一系列的数据变化、转换或组合等方式形成属性。 本案例通过对电视产品个性化推荐业务的理解,为每个标签的实现制定了相应的规则。 在建立用户画像的标签库后,对标签属性进行构造。其中,对用户收视行为信息数据中可以实现的用户标签进行描述。 属性构造 立足于电视产品推荐业务的角度,需要采用现有数据建立出用户的标签库,如图所示。 属性构造 1. 用户标签库 给用户贴标签是大数据营销中常用的做法,所谓“标签”,就是浓缩精炼的、带有特定含义的一系列词语,用于描述真实的用户自身带有的属性,方便

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档