- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电视产品个性化推荐;;伴随者互联网和移动互联网的快速发展,各种网络电视和视频应用(如爱奇艺、腾讯视频、乐视视频、芒果TV等)遍地开花,人们的电视观看行为正发生变化,由之前的传统电视媒介向电脑、手机、平板端的网络电视转化。
在这种新形势下,传统广播电视运营商明显地感受到危机。此时,“三网融合”为传统广播电视运营商带来发展机遇,特别是随着超清/高清交互数字电视推广,广播电视运营商可以和家庭用户实现信息实时交互,家庭电视也逐步变成多媒体信息终端。;信息数据的收集过程如右图所示,每个家庭收看电视节目都需要通过机顶盒进行收视节目的接收和交互行为(如点播行为、回看行为)的发送,并将交互行为数据发送至相应每个区域的光机设备(进行数据传递的中介),光机设备会汇集该区域的信息数据,最后再发送至数据中心进行数据整合、存储。;由于已建设的大数据平台积累了大量用户基础信息和用户观看记录信息等数据,所以在此基础上进一步挖掘出数据价值、形成用户画像,提升客户体验,并实现精准的营销推荐。
总而言之,电视产品推荐可以为用户提供个性化的服务,改善用户浏览体验,增加用户黏度,从而使用户与企业之间建立稳定交互关系,实现客户链式反应增值。
;在大数据平台中存有用户的基础信息(安装地址等)和双向互动电视平台收视行为数据(直播、点播、回看、广告的收视数据)等共7种数据。
本次读取了2000个用户在2018年5月12日至2018年6月12日的收视行为信息数据,并对该数据表进行脱敏处理。;属性名称;属性名称;如何将丰富的电视产品与用户个性化需求实现最优匹配,是广电行业急需解决的重要问题。用户对电视产品的需求不同,在挑选搜寻想要的信息过程中,需要花费大量的时间,这种情况的出现造成了用户的不断流失,对企业造成巨大的损失。
本案例根据电视产品个性化推荐项目的业务需求,即需要实现的目标如下。
通过深入整合用户的相关行为信息,构建用户画像。
利用电视产品信息数据,针对用户提供个性化精准推荐服务,有效提升用户的转化价值和生命周期价值。
;广电大数据营销推荐的主要步骤如下。
对原始进行数据清洗、数据探索、属性构造(构建用户画像)操作。
划分训练数据集和测试数据集。
使用基于物品的协同过滤算法和基于流行度的推荐算法进行模型训练。
训练出推荐模型后进行模型评价。
根据模型的推荐结果所得到的不同用户的推荐产品,采用针对性的营销手段提出建议。
;目标;;在用户的收视行为信息数据(media_index)中,存在直播频道名称(station_name)属性含有“-高”清的情况,如“江苏卫视-高清”,而其他直播频道名称属性中为“江苏卫视”。由于本案例中暂不分开考虑是否为高清频道的情况,所以需要将直播频道名称中“-高清”替换为空。
从业务角度分析,该广播电视运营商主要面向的对象是众多的普通家庭,而收视行为信息数据中会存在特殊线路和政企类的用户,即用户等级号(owner_code)为02、09、10的数据与用户等级名称(owner_name)为EA级、EB级、EC级、ED级、EE级的数据。因为特殊线路主要是起到演示、宣传等作,用这部分数据对于分析用户行为意义不大,并且会影响分析结果的准确性,所以需要将这部分数据删除。而政企类数据暂时不做营销推荐,同样也需要删除。
;在收视行为信息数据中存在有同一用户开始观看时间(origin_time)和结束观看时间(end_time)重复的记录数据,而且观看的节目不同,如图所示,这可能是由于数据收集设备导致的。经过与广电运营商的业务人员沟通之后,默认保留第一条收视记录,因此需要基于数据中开始观看时间(origin_time)和结束观看时间(end_time)的记录进行去重。
;在收视行为信息数据中存在跨夜的记录数据,如开??观看时间和结束观看时间分别为05-12 23:45:00和05-13 00:31:00,如图所示。为了方便后续用户画像的构建(需要与辅助数据做关联匹配),这样的数据的记录需要分为两条记录。;在对用户收视行为信息数据进行分析时发现,存在用户的观看时间极短的现象,如图所示,这部分观看时间过短可能是因为用户在观看中换频道。经过与广电运营商的业务人员沟通之后,选择观看时长小于4秒作为时间极短的判断阈值,将小于阈值的数据称为异常行为数据,统一进行删除处理。;此外,还存在用户较长时间观看同一频道的现象,这部分观看时间过长可能是因为用户在收视行为结束后,未能及时关闭机顶盒或其他原因造成。这类用户在广电运营大数据平台中数据记录中,未进行收视互动的情况下,节目开始观看时间和结束观看时间的单位秒为00,即整点(秒)播放。经过与广播电视运营商的业务人员沟通之后,选择将直播收视数据中开始观看时间和结束观看时间的单位秒为00的记录删除。
最后,发现数据有下次观看的开始观看时
您可能关注的文档
- 《Python数据分析与挖掘实战》教学大纲.docx
- 《Python数据分析与挖掘实战》教学大纲.pdf
- 第1章 数据挖掘基础《Python数据分析与挖掘实战》.pptx
- 第2章 Python数据分析简介《Python数据分析与挖掘实战》.pptx
- 第3章 数据探索《Python数据分析与挖掘实战》.pptx
- 第4章 数据预处理《Python数据分析与挖掘实战》.pptx
- 第5章 数据挖掘算法基础《Python数据分析与挖掘实战》.pptx
- 第6章 信用卡高风险客户识别《Python数据分析与挖掘实战》.pptx
- 第7章 餐饮企业菜品关联分析《Python数据分析与挖掘实战》.pptx
- 第8章 金融服务机构资金流量预测《Python数据分析与挖掘实战》.pptx
最近下载
- 五恒系统方案书.pdf VIP
- 全套干扰峰分析图解析.docx
- 第十五讲新时代与中华民族共同体建设(2012— -中华民族共同体概论专家大讲堂课件.pdf VIP
- 种植施肥机械——栽植机械(水稻钵苗栽植机械)课件讲解.pptx VIP
- 企业工会助推企业高质量发展.docx VIP
- 施工技术管理措施.doc VIP
- 第六章维生素与辅酶.ppt VIP
- DB65T 4063-2017 沙化土地封禁保护区沙障技术技术工程.pdf VIP
- 2026江苏辖区农村商业银行泗阳农村商业银行校园招聘15人笔试备考试题及答案解析.docx VIP
- 种植施肥机械——栽植机械(水稻插秧机)课件讲解.pptx VIP
文档评论(0)