- 2
- 0
- 约1.58万字
- 约 9页
- 2017-06-12 发布于湖北
- 举报
State管理之updateStateByKey和mapWithState解密分析
State管理之updateStateByKey和mapWithState解密
背景:
整个Spark Streaming是按照Batch Duractions划分Job的。但是很多时候我们需要算过去的一天甚至一周的数据,这个时候不可避免的要进行状态管理,而Spark Streaming每个Batch Duractions都会产生一个Job,Job里面都是RDD,所以此时面临的问题就是怎么对状态进行维护?这个时候就需要借助updateStateByKey和mapWithState方法完成核心的步骤。
源码分析:
1. 无论是updateStateByKey还是mapWithState方法在DStream中均没有,但是是通过隐身转换函数实现其功能。
object DStream {
// `toPairDStreamFunctions` was in SparkContext before 1.3 and users had to
// `import StreamingContext._` to enable it. Now we move it here to make the compiler find
// it automatically. However, we still keep the old function in StreamingContex
您可能关注的文档
最近下载
- 城市道路护栏清洗装置设计(已改).doc VIP
- 一年级数学20以内加减法计算专项练习题(共42份,每日一练).docx VIP
- 一年级数学20以内加减法计算专项练习题(共41份,每日一练).docx VIP
- “两个细则”考核防范措施.pdf VIP
- 一年级数学5以内加减法计算练习题(每日一练,共33份).docx VIP
- 一年级数学5以内加减法计算练习题(每日一练,共29份).docx VIP
- 痛风石诊疗共识解读2026.pptx VIP
- 雅马哈船外机用户手册2021+(GP1800R+SVHO)+F4P-F8199-70中文.pdf VIP
- 诊疗方案知情选择同意书.doc VIP
- 配送网络布局优化(35页PPT).ppt VIP
原创力文档

文档评论(0)