- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小数据到大数据之路
范学蠡
本来生活
个人微信号
介绍本来生活网数据体系的演变:SQL Server到Hadoop生态
1 本来BI从这里开始
目录 2 数据仓库下的BI
3 Hadoop体系下的BI
Part I 本来BI从这里开始
本来生活网从褚橙开始走上生鲜电商的舞台
BI报表系统1.0
BI报表系统
业务数据库 SSIS 数据集市
(读) /ETL SQL Server
遇到的问题
① 集市数据粒度粗,导致报表的重用性差
② 同样的统计时间段,在不同时间点跑出来的数据不一样
③ 数据口径的统一很困难
CRM ?
人工抽取用 绑券
ERP
户数据
短信
遇到的问题
① 大量的人力花在了抽数、绑券这种价值感很低的事情上。
② 出错率居高不下、业务抱怨不断。
③ 人员流动率高。
流量分析1.0 ?(第三方统计)
① 只能看到概览性质的数据(PV、UV )。
② 很难把流量数据和业务系统内的数据关联。
③ 关键路径的转化率很难统计。
④ 微信的细分流量很难统计。
⑤ ……
Part 2 数据仓库时代的BI
越来越多的水果大品在本来生活网获得了非常好的销量和口碑
BI报表系统2.0(基于数据仓库)
BI报表系统2.0
CRM
业务数据 数据预处理 数据处理 数据应用
(读库 )
ODS DW DM
第三方流 数据库 数据库 数据库 OLAP
量数据
数据调度SSIS/ETL
优势和解决的问题
① 在一定数据量下Kimball 的维度建模表现优异。
② 按不同层次的粒度对数据建模,拥有良好的重用性。
③ 数据仓库层统一报表数据源,解决数据一致性问题。
新的问题
① 流量数据接入后,SQL Server 数据仓库的硬盘空间不够用。
② T+1的方式招到的业务的挑战越来越多。
③ ETL的依赖越来越复杂,ETL的执行时间越来越久。
一些建议和推荐
CRM 2.0 (基于SQL Server )
CRM 运营管理平台
ETL CRM数据
Push
数据仓库 主数据 客户库
您可能关注的文档
- 利用大数据创造信息优势.pdf
- 云计算大数据平台项目建设方案.pptx
- 大数据助力能源行业智能运营.pdf
- 当GIS遇上大数据.pdf
- 大数据时代的GIS基础软件技术发展.pdf
- 运营商大数据平台规划方案.pptx
- 大数据创新服务平台.pptx
- 大数据分析平台的应用.pptx
- 金融保险行业大数据解决方案.pptx
- MySQL DBA技术介绍.pdf
- 艾瑞咨询-2025年中国舒适眼镜白皮书.pptx
- 专题01 Units 4-6 重点语法归纳 七年级英语上学期期末考点(仁爱科普版2024).pptx
- 安全生产事故隐患大排查“百日攻坚”行动方案.PDF
- 第8课 欧洲的思想解放运动 课件高一下学期统编版(2019)必修中外历史纲要下(3).pptx
- 机械制图相关知识C语言及投影法等内容测试试卷.docx
- 第8课 欧洲的思想解放运动高一下学期统编版(2019)必修中外历史纲要下.pptx
- 第8课 现代社会的移民和多元文化 课件-高二历史统编版(2019)选择性必修三.pptx
- AIGC赋能高职“汽车新媒体营销”课程的应用探索.pdf
- 第8课 中国古代的法治与教化 课件-高三历史统编版(2019)选择性必修1一轮复习.pptx
- 21(null)大型购物中心 室内空气质量 解决方案.pdf
文档评论(0)