海 量 数 据 在 线 分 析 技 术 剖 析
北 京 博 睿 宏 远 数 据 科 技 股 份 有 限 公 司 程 捷
前言
Hadoop将我们带入了大数据时代,使得处理TB级别乃至PB级别的数据成为一种可能。但众所周知,依
赖于MapReduce计算框架,导致实时性方面一直是Hadoop的一个硬伤。因此,如何实现对海量数据
秒级在线分析成为了不少大数据分析软件的核心目标。
好的数据存储和分析方案应该满足的标准
保证数据的原始列信息完整,即数据 支持超大数据集的在线聚合秒级响应
无损失
数据实时性 ,数据从产生到可查询不 数据存储设计灵活通用,可便利进行
应有太大延迟 业务扩展和兼容其他计算引擎
支持SQL-like查询方式,可灵活且快 数据支持编码和压缩存储,不存在明
速响应业务需求 显的数据膨胀现象
您可能关注的文档
- 测试基础架构的演进之路.pdf
- 从位置服务到数据赋能.pdf
- 奥飞数据系统架构演进.pdf
- 大数据驱动下的互联网金融创新.pdf
- 电商大促的安全保障.pdf
- 大型企业云平台的实践之路.pdf
- 多业务场景下的灰度解决方案.pdf
- 饿了么API框架的实践.pdf
- 高德地图SDK自动化实践之路.pdf
- 高可用高性能服务器编程架构实践.pdf
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
原创力文档

文档评论(0)