- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章
状态和检查点
什么是有状态的计算
• 有状态计算的潜在场景
• 数据去重:需要记录哪些数据已经流入过应用,当新数据流入时,根据已流入数据
去重
• 检查输入流是否符合某个特定模式:之前流入的数据以状态的形式缓存下来
• 对一个窗口内的数据进行聚合分析,比如分析一小时内某项指标75分位值或99分
位值
• Flink分布式计算,一个算子有多个算子子任务
• 状态可以被理解为某个算子子任务在当前实例上的一个变量,变量
记录了数据流的历史信息,新数据流入,可以结合历史信息来进行
计算
• 接收输入流 / 获取对应状态 / 更新状态
状态管理的难点
• 要解决问题:
• 实时性,延迟不能太高
• 数据不丢不重、恰好计算一次,尤其发生故障恢复后
• 程序的可靠性要高,保证7*24小时稳定运行
• 难点
• 不能将状态直接交由内存,因为内存空间有限
• 用持久化的系统备份状态,出现故障时,如何从备份中恢复
• 需要考虑扩展到多个节点时的伸缩性
• Flink解决了上述问题,提供有状态的计算API
Flink的几种状态类型
l Managed State 和 Raw State
• 托管状态(Managed State )是由Flink管理的,Flink帮忙存储、恢复和优化
• 原生状态(Raw State )是开发者自己管理的,需要自己序列化
l Managed State又细分为Keyed State和Operator State
Managed State Raw State
状态管理方式 Flink Runtime托管,自动存储、自动恢复、自动伸缩 用户自己管理
状态数据结构 Flink提供的常用数据结构,如ListState、MapState等 字节数组 :byte[]
使用场景 绝大多数Flink函数 用户自定义函数
Keyed State和Operator State
l Keyed State是KeyedStream上的状态,每个Key共享一个状态
l Operator State每个算子子任务共享一个状态
Keyed State Operator State
相同Key的数据可以访问、更新这个状态 流入这个算子子任务的所有数据可以访问、更新这个状态
Keyed State和Operator State
l Keyed State和Operator State都是基于本地的,每个算子子任务维护着自身的状态,不能访问其他算子子任务的状态
l 具体的实现层面,Keyed State需要重写Rich Function函数类,Operator State需要实现CheckpointedFunction等接口
Keyed State Operator State
适用算子类型 只适用于KeyedStream上的算子 可以用于所有算子
状态分配 每个Key对应一个状态 一个算子子任务对应一个状态
创建和访问方式 重写Rich Function,通过里面的 实现CheckpointedFunction等接口
RuntimeContext访问
横向扩展 状态随着Key 自动在多个算子子任务上 有多种状态重新分配的方式
迁移
支持的数据结构
您可能关注的文档
- 新媒体平台运营实战教学大纲3.pdf
- 新媒体推广课程教学标准4.pdf
- 新媒体文案教学大纲3.pdf
- 移动营销教学教案30.pdf
- 移动营销课程教学大纲12.pdf
- 网店运营实务课程标准4.8.docx
- 《WindowsServer2016网络管理项目实践教程》SPOC导入操作说明.pdf
- AfterEffectsCC核心应用案例教程教学教案18.pdf
- DreamweaverCC网页设计与应用教学教案16.pdf
- Flink原理与实践教学大纲6.pdf
- 2025年环境传感器行业技术前沿及报告.docx
- 2025年智能垃圾分类设备全球市场发展报告.docx
- 《2025年无人机电池能量回收系统设计进展与低空物流效率优化》.docx
- 《储能电池回收报告2025:长尾词回收成本降低策略》.docx
- 《2025年mRNA技术平台在疫苗研发中的数字化研发技术应用报告》.docx
- 深度解析(2026)《GBT 24501.2-2009小麦条锈病、吸浆虫防治技术规范 第2部分:小麦吸浆虫》(2026年)深度解析.pptx
- 2026年度全国助理社会工作师职业水平《社会工作实务》考试题最新.docx
- 2026年度全国助理社会工作师职业水平《社会工作实务》考试题最新.docx
- 2025年量子通信行业投资机会与风险评估报告.docx
- AI内容剪辑行业报告202短视频制作内容生态分析.docx
最近下载
- 金融风险管理(中央财经大学)中国大学MOOC(慕课)章节测验试题(答案).pdf
- 2025年水体富营养化微生物修复技术效果评价报告.docx
- 新版人教版小学数学四年级上册期末综合试题 含 答案.docx
- Nigerian Investment Promotion Committee尼日利亚投资促进委员会Investment Guide入门指南.pdf
- 给排水国标图集-05SS521:预制装配式钢筋混凝土排水检查井.pdf VIP
- 世界职业院校技能大赛.pptx VIP
- 《铁路劳动安全》高职铁道类专业安全教育培训全套教学课件.pptx
- 竣工资料整理资源配置要点.docx VIP
- “空巢老人”的专职司机.pdf VIP
- 台凌(TAILING)tl100变频器说明书使用手册.pdf
原创力文档


文档评论(0)