- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从日志统计到大数据分析;2008:日志统计平台
2011:用户数据仓库
2013:数据源管理;需求响应周期长
运维成本高
运行速度慢
员工个人成长受限;基于 Hadoop 的日志统计平台;;;;计算资源需求急剧膨胀
数据质量没有保证
数据价值没有充分利用;统一的用户数据仓库;User Data Warehouse;全公司所有业务线的用户行为数据统一到一张表,通过用户ID 可以访问到用户在全百度上的所有行为;;直接从数据源头治理;非结构日志源;结构化日志源(Google Protocol Buffer):;;数据源统一管理,覆盖数万台服务器
数据源头产生,既可实时 SQL 分析;数据源很重要
Event 模型很有效;数据采集手段在增强
大数据计算能力的软硬件环境在成熟
竞争加剧,整个行业的数据意识在提升;人力成本
时间成本;数据采集能力不足
分析能力比较基础
数据资产顾虑;神策分析;可以私有化部署的 用户行为分析产品;;;;全端数???接入;;PaaS 平台;;;架构实现;适应私有化部署
数据与处理能力完全开放
模型精简,减少 ETL 开销
支持每天十亿级别数据
秒级导入,秒级查询;;利用神策的查询开放接口,可以非常容易的:;在线分析;金融;在线医疗 新媒体
文档评论(0)