- 1
- 0
- 约4.56千字
- 约 8页
- 2026-05-25 发布于河北
- 举报
大数据平台之数据存储
一、前言
我们都知道,采集数据之后,得到数据是原始的和杂乱的,必须经过专
门的洗、关联、规范化和精心的组织建模,而且要通过数据质量检
测后才能进行后续的数据分析或用于提供数据服务,而这就是数据平台
构建的关键环节•。数据存储处理
而我们今天要聊的是大数据平台是如何去存储海量数据呢?
在之前,我们聊过,大数据的数据采集并存储的数据流程,如下图所
示:
Spark/FlinkUklkd光客
在整个大数据生态圈里,数据存储可以分为两大类:
1、是直接以文件形式存放在分布式文件系统上,处理工具可以直接读
写(Hive和SparkSQL都是这类)。
2、通过kafak存储实时数据,经过实时计算框架最后把指标数据利用
NoSQL数据库来存储和管理数据(NOSQL数据库Hbase之类)。
二、数据存储的发展
2.1传统数据存储
互联网时代各种存储框架层出不穷,眼花缭乱,比如传统的OLTP关系
型数据库
您可能关注的文档
最近下载
- 股票营销话术技巧及股票营销话术技巧(全).doc VIP
- 磁悬浮压缩机中文手册.pdf VIP
- 地方公务员考试:2022西藏真题及答案.pdf VIP
- 宜宾三江新区事业单位2025年第一次公开考核招聘工作人员(26人)考前自测高频考点模拟试题含答案解析.docx VIP
- 超星尔雅学习通《大学生就业指导》章节测试答案.doc VIP
- 2026瑞众保险全国校园招聘笔试题库及答案解析.docx VIP
- 西门子S7-1500 PLC编程及应用-全套PPT课件.pptx
- 九年级数学第六章集体备课《反比例函数》教学设计.doc VIP
- XX医院安全生产责任制实施办法.docx VIP
- JB∕T 8401.1-2017 旋耕联合作业机械 第1部分:旋耕施肥播种机.docx VIP
原创力文档

文档评论(0)