- 1
- 0
- 约1.58千字
- 约 2页
- 2026-06-25 发布于北京
- 举报
《009_flink的革新:流批一体的计算架构》
其实平时我们玩儿大数据,大数据,就是去先收集到需要的数据,接着对数据做处理,
处理后有两种用途:第一种就是数据分析,以数据仓库为,数据分析能力,这个占
到了大多数场景,80%;第二种是用数据支撑各种业务功能和智能行为,比如说个性化推荐、
搜索、、金融、风控,等等,这个也很多,但是占比相对属于少部分,20%
玩儿数据,数据-处理数据-使用数据(80%以上是报表,20%是支撑高大上
的场景和功能)
收集数据一般都有哪些呢?最基础的就是互联网产品的用户行为日志,其次还有比如信用
卡事务、物联网设备的数据上报、服务器的自身日志,等等,这些都是常见的收集的数
据,但是所有的数据,其实都是一种数据流
也就是每条数据都有一个产生的时间,他们都是持续不断的产生的,然后源源不断的被我们
收集到以后写入kafka里面去,或者是不断的写入到hdfs里去,这就是一个数据的过
程,对吧?
所以以前往往是离线数据和实时数据分离的计算架构,也就是用storm、sparkstreaming一
类的技术对kafka里的实时数据做计算,就是实时计算,用spark、hive、mapreduce一类的
离线批处理分布式计算技术对hdf
您可能关注的文档
- g n o及环道南区地块地下二层照明配电箱系统图.pdf
- 增强型地热系统地下裂隙结构流阻模型研究.pdf
- 非货币性资产交换商业实质判断与会计处理实务指南.pdf
- 外研英语七级上册模块检测2:人物与地点.pdf
- TRAIL信号分子在宫颈鳞状细胞癌中预后价值研究.pdf
- 信息技术年度运营与质量报告.pdf
- 液压-燃气初步设计说明书:减压阀组与TRT系统.pdf
- 电子支付牌照发放推动行业革新与共赢.pdf
- 合管部员工推荐动员会纪要:政策与详情.pdf
- 语文七色光七导学案:多音字与风景古诗名句学习与积累.pdf
- 2026年六年级语文下册第一单元同步练习题及参考答案.docx
- 2025-2026学年宝应县数学三年级下学期期中质量跟踪监视试题含答案.docx
- 2026年八年级英语中考英语听力场景词汇汇总卷(含答案及解析).docx
- 2026年建筑工地施工安全培训教材.docx
- 2025-2026学年宝应县数学三年级下学期期中质量跟踪监视试题含答案解析.docx
- 2026年六年级语文下册小升初综合单元测试卷考试试题及答案.docx
- 2026年八年级英语中考英语阅读答题思路汇总卷(含答案及解析).docx
- 2026年建筑行业六月施工质量与安全管理方案.docx
- 2025-2026学年宝应县数学三年级下学期期中质量跟踪监视试题含解析.docx
- 2026年教师招聘皮亚杰维果茨基理论配套考题及参考答案.docx
最近下载
- 特种设备租赁安全生产管理协议书6篇.docx VIP
- 南京审计大学《管理学(I)》2023-2024学年第一学期期末试卷.doc VIP
- 《GB_T9119-2016法兰标准》.doc
- 施工场地扬尘排放标准 DB52_ 1700-2022_可搜索.pdf
- 2026年辽宁省阜新市社区工作者考试试卷及答案.docx VIP
- 2026年辅警辅警考试题库完美版.docx VIP
- 东校区生活污水处理站设计.doc
- 三洋伺服Q系列说明书.pdf VIP
- 广东培正学院《高等数学Ⅱ》2025-----2026学年期末试卷(A卷).docx VIP
- 《环境感知技术》2024年课程标准(含课程思政设计).docx VIP
原创力文档

文档评论(0)