- 0
- 0
- 约3.7千字
- 约 2页
- 2026-05-28 发布于北京
- 举报
《085_基于HBase+Kylin实现的OLAP分析架构(1)》
早期那套基于大数据生态的数据仓库+Hive/SparkSQL+MySQL的OLAP分析架构其实跑着
还算凑合,但是这里的就是在于轻度聚合以后的数据会放到MySQL里去,这个数据量
不能太大,毕竟我们是要对MySQL里的数据跑各种维度groupby以后的分析语句的,就算
是建好了索引,但是单表在百万级的数量已经是极限了
增量的明细数据有1亿,3个维度,维度1的取值有100种,维度2的取值有1000值,
维度3的取值有10000种,100*1000*10000=10亿
所以后来慢慢发现这个数据仓库里轻度聚合后的数据量越来越大,经常聚合后的数据量有
日增几十万,全表都千万级了,基于MySQL跑的OLAP分析语句越来越,都跑不动了,
这个时候这套架构就有点问题了
儒猿技术窝的《从0开始带你成为MySQL实战高手》,MySQL的B树索引原理,索引里的
数据很多,内存放不下太多的缓存页,索引深度很深,每次就算基于索引搜索,也要在磁盘
里大量的磁盘IO才可以
所以后来开始涌现HBase+Kylin的这套架构,Kylin本身就是依赖于HBase的,这套架构的
就是依然会对数据进行轻度聚合和汇总,但是预聚合以
您可能关注的文档
最近下载
- 《建筑地基基础设计规范》GB50007-2011.doc VIP
- 2020年江苏省普通中学学业水平合格性考试样卷物理.doc VIP
- 开源量化评论(82):价值增强Plus组合构建与多策略融合实践-20231121-开源证券-21页.pdf VIP
- 2025年抖音主播职业调研报告-浙江大学.pdf VIP
- 《给阿嬷的情书》剧情介绍及观后感.pptx VIP
- 江苏省徐州市铜山区2024-2025学年高二上学期月期中考试物理(合格考)含答案.docx VIP
- 莱芜城源净水厂升级改造工程.pdf VIP
- 国开(FJ)-国际礼仪概论-形成性考核任务三-学习资料.docx VIP
- 2024年湖南省高中学业水平数学真题(学生版+解析版).docx
- 脊柱损伤患者搬运课件.pptx VIP
原创力文档

文档评论(0)