Apache Flink开发案例大全.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ApacheFlink

案例集

01

01

数据集成

02

数据分析

Xtransfer

Flink

MongoDBCDC

XTransfer

的生产实践

众安保险

Flink

众安保险金融业务的应用

奇安信

如何设计信息安全领域的实时安全基线引擎

商银

工商银行实时大数据平台建设历程及展望

Flink

的风控特征工程应用

红书

Native

Flink

onKubernetes

在小红书的实践

美团

Flink

的实时数仓平台建设

伴鱼基于

Flink

构建数据集成平台的设计与实现

Bilibili

Flink

B

站的多元化探索与实践

基于阿里云

Flink

的实时风控实践

金科

Apache

Flink

在国有大型银行智能运营场景下的应用

移动云

Apache

Flink

的应用与实践

冀支付

基于

Flink

的实时计算平台实践

Flink

流批一体在小米的实践

汽车

Apache

Flink

在蔚来汽车的应用

37

手游

基于

FlinkCDC+Hudi

湖仓一体方案实践

快手

Flink

SQL

在快手的扩展和实践

网易互娱

基于

Flink

的支付环境全关联分析实践

汽车之

Flink

的实时计算平台

3.0

建设实践

03

73

81

89

105

29

11

97

19

35

23

43

51

59

03

机器学习

05

数字化转型

目录

BIGO

BIGO

使用

Flink

OLAP

分析及实时数仓的实践和优化

65

04

云原生

斗鱼

Apache

Flink

在斗鱼的应用与实践

1

21

米哈游

Flink

在米哈游的落地实践

1

27

京东

Flink

onK8s

在京东的持续优化实践

113

联通

Flink

的风控特征工程应用

1

33

1

41

1

49

1

55

1

59

1

65

ApacheFlink案例集

ApacheFlink案例集

ApacheFlink案例集

3

小米

Flink流批一体在小米的实践作者:金风

用户背景

4对于流批一体的平台化建设

4

对于流批一体的平台化建设

主要分为

4

个方面

分别是元数据管理

权限管理

作业调度以及

Flink

的生态

建设

1

元数据管理

小米基于

Metacat

做了统一的元数据管理

Metacat

统一对接下游不同的存储系统和上游的计算引擎

上图是小米当前的实时和离线框架

目前是多种框架并存的状态

业务开发人员无论是写

SQL

作业还是写

Jar

包作业

都至少要维护两套代码

公司内部的计算引擎

团队

分别

维护不同的计算框架

同时平台

要对不同的计算引擎

做不同的

适配

基于上

述情况

小米开始

致力

于流批一体的改造

实时和离线维护同一套计算框架

为业务开发人员

平台提

方和计算引擎的

支持

大化节省人

资源

Apache

Flink

例集

基于

Metacat

内部的

有系统都

统一

分成

FlinkSQL

对应

第一级

Catalog

主要由

和集

群名拼

第二级

Database

与大部分系统的

Database

保持

Database

的系统

默认

使用

default

来代替

第三级

Table

也与系统的

Table

保持

队列

topic

Elasticsearch

的索引

在构建

统一的元数据管理之

只需

要写一

DML

语句即

成一个实时将

队列

数据入湖作业的开发

2

权限管理

平台建设

业务需求

小米的大数据发展演变史大概如下:

2019年之前,小米的实时计算主要以SparkStreaming为主,少部分Storm,离线计算以Spark为主;

2019年,开始接入Flink,并广泛应用于信息流搜索推荐、广告实时样本、实时ETL等场景,逐步替换了原来的SparkStreaming作业,得益于Flink框架的各种优秀特性,在作业的正确性,实时性,资源使用效率方面都有较大提升;

2020年,开始接入使用FlinkSQL,并广泛用于实时数仓的建设和实时ETL作业的开发。FlinkSQL的实时数仓将数据链路由T+1降低到了秒级;

2021年,开始接入

文档评论(0)

MAX知识点 + 关注
实名认证
文档贡献者

资料收集达人

版权声明书
用户编号:8053033065000020

1亿VIP精品文档

相关文档