刘建刚-腾讯大数据实时资源弹性伸缩的前沿探索与实践.pdfVIP

刘建刚-腾讯大数据实时资源弹性伸缩的前沿探索与实践.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

刘建刚

腾讯大数据实时平台Flink引擎负责人

基于ApacheFlink打造Oceanus一站式实时计算解决方案,集实时应用的创建、调试、部署、运行、运维和监控为一

体,为实时应用提供全生命周期的服务,覆盖微信支付、腾讯视频、腾讯广告等集团所有业务。

整体规模

•机器核数:百万级别

•作业个数:上万级别

•流量峰值:十亿级别

应用场景

•实时报表

•特征生产

•湖仓一体

•数据同步

整体架构

目录

从零断流到智能自治的一体化架构

Flink介绍:以流计算为内核的新一代计算引擎,提供基于数据流的有状态计算。

相比storm(流计算开创者),flink有以下优势:

•保障数据exactly-once,通过localstate和基于Chandy-

Lamport算法的快照来保障数据的不丢不重。

•完善的Event-time机制,通过watermark解决了无限流的触

发、延迟等问题。

•低延迟、高吞吐,主要通过资源管理、网络优化等来实现。

Flink是有状态的long-running在线计算,具备以下特征:SLA要求高

1.时间维度上,作业流量呈潮汐规律变化,有上涨或者下降的趋势。在支付/直播等场景,稳定性要求至少

99.99%,重启断流、资源不足导致的

2.空间维度上,不同pod的负载不同,资源需求也不一样

failoverlag严重影响SLA。

成本压力大

在数据同步、实时报表等场景,按最大

值配置资源会导致严重浪费,业内资源

利用率普遍低于40%。

运维成本高

流式计算自身复杂性导致问题排查困

难,低延迟要求做到7×24

文档评论(0)

150****8957 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档