- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用文档
电视用户数据剖析
实用文档
文档改正记录
修他日期改正人改正说明版本号改正页
实用文档
目
录
1
总体描绘
........................................................................
4
1.1
建设目标................................................................
4
1.2
整体架构................................................................
4
2
功能实现
........................................................................
6
2.1
数据采集模块............................................................
6
数据收集............................................................
6
数据办理............................................................
6
2.2
数据剖析................................................................
7
2.3
数据可视化..............................................................
8
2.4
系统管理................................................................
9
3
初步方案
.......................................................................
10
3.1
C平台接口日志剖析......................................................
10
3.2
流水文件剖析...........................................................
11
4
技术实现
.......................................................................
11
实用文档
总体描绘
1.1建设目标
互联网电视是成立在通信网络上的互动性视频服务,能够特别灵活地实现电子菜单、
节目预约、实时快进、快退等操作。经过对OTT用户的实时数据收集,统计剖析,建设
实时数据剖析系统,对OTT的EPG界面设计、内容营运有着重要意义。
系统在经过对OTT业务营运平台数据收集的基础上,实时(定期)获取用户行为数
据,联合业务营运平台数据日志、用户端APK上报日志等数据,经过大数据办理平台(如
Hadoop),对OTT的各纬度指标进行统计剖析,并提供用户自定义剖析功能,进行数据
展示,为EPG的界面设计和营运建设提供决议依据。
1.2整体架构
实用文档
数据抓取
负责整个互联网电视营运中心平台或许分平台系统的原始基础数据的获取,包括2部分内容:(1)平台日志:联合营运平台的日志管理模块,实现获取并接收用户的行为数据;(2)APK日志上报。提供数据接口,且支持FTP等传输导入。
数据抓取用于接入存储数据,目前分为三部分:
(1)C平台各业务系统经过AOP方式将各接口调用情况输出标准日志,由FLUME进行抓取;再经过KAFKA将数据输送到STORM中;STORM将元数据直接寄存到HDFS中。
(2)各业务系统的错误日志变换为json后直接寄存到ES中,方便查找。
(3)将流水文件(需变换为csv格式)和流水日志(导出txt格式)经过文档上传系统上传到HDFS中,文件所在的文件夹以当天日期命名(减少需办理的文件数量,提高效率)。
数据剖析
鉴于hadoop大数据办理技术,将数据收集获取到的基础数据,进行数据预办理、数据统计计算,包括数据排重、数据冲洗、结果展示指标计算等,并将原始数据、结果表
数据进行存储和备份。根据多维度的数据展示需求,设计结果表数据,并对其进行实时统计计算,并将结果数据,推送给前端展示平台。此外还提供用户自定剖析功能,用于对原始数据和结果表数据的自定义查问和剖析功能,便于非数据剖析人员对系统进行二次剖析。
数据剖析用于对指定数据进行切割分解为各个维度,给展示系统提供数据支撑:
(1)由STORM对C平台接口日志进行办理,将办
文档评论(0)