12-第十二章 Hadoop 实时数据处理技术
第十二章 Hadoop实时数据处理技术 学习目标 ·了解 Hadoop 实时处理技术的进展? ·了解 Storm 实时处理技术? ·了解 Storm-Yarn 实时处理技术? ·了解 Spark 实时处理技术 1. Hadoop 实时处理技术的进展 1. 过去十年Hadoop、Map/Reduce 等相关技术实现了针对大量数据的分布式存储 和处理操作,极大地提高了处理效率,并降低了传统技术的处理成本 2. 近几年,互联网中的数据增长速度出现了前所未有的突破,数据量越来越大,数据的价值却呈现出昙花一现,若不及时对其进行处理,很容易被海量的数据集弱化,Hadoop 和 Map/Reduce在处理效率和响应速度上都不能满足数据实时处理的要求,所以Storm应运而生。 2. Storm ·什么是Storm Storm 起源于 Twitter,后来贡献给 Apache 自由软件基金会,这是一个分布式的、容错的实时计算系统,它被托管在GitHub上。 Storm 简化了传统方法对无边界流式数据的处理过程,可以对数据进行实时分析、在线机器学习、持续计算、数据仓库技术以及可以简化分布式 RPC 的处理过程等。 · Apache Storm 组成结构 类似于map/reduce中的Namenode和Datanode. · Storm数据流 流在Storm内各组件
您可能关注的文档
最近下载
- 译林版高中英语选择性必修第二册同步教学课件(2025年7月修订).ppt
- 仙剑98 超级详细攻略.docx VIP
- (全国乙卷)2022年高考真题——理科数学(全国乙卷)试卷.pdf VIP
- 吉泰科GK800变频器用户手册.pdf
- 精英型分体式热水器说明书款.pdf VIP
- 2024-2023年住院医师规范化培训-住院医师规范化培训(胸心外科)考试练习精品.pdf VIP
- 湖北省襄阳市随州市部分高中2024-2025学年高二下学期6月期末联考语文试卷(含答案).docx VIP
- 2025年住院医师规范化培训结业理论考核(胸心外科)历年参考题库含答案详解.docx VIP
- 2020年高考全国Ⅰ卷(英语)真题(含答案).pdf VIP
- 桥本氏甲状腺炎功能医学干预案例王树岩案例刘女士38岁身高.DOC
原创力文档

文档评论(0)