SQL查询组FlinkSQL流式查询引擎深度解析98课件.pptxVIP

SQL查询组FlinkSQL流式查询引擎深度解析98课件.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

SQL查询主讲人:课程组——FlinkSQL流式查询引擎深度解析

目录CATALOG0203基础查询操作04高级聚合操作0506特殊流处理语法关联查询操作其他相关操作01测试环境创建

测试环境创建01

1.创建数据生成器源表、输出表CREATETABLEsource(idINT,tsBIGINT,vcINT)WITH(connector=datagen,rows-per-second=1,fields.id.kind=random,fields.id.min=1,fields.id.max=10,fields.ts.kind=sequence,fields.ts.start=1,fields.ts.end=1000000,fields.vc.kind=random,fields.vc.min=1,fields.vc.max=100);源表输出表INSERTINTOsinkSELECT*FROMsource;流式传输CREATETABLEsink(idINT,tsBIGINT,vcINT)WITH(connector=print);输出表

2.输出结果+I[id=7,ts=1,vc=42]+I[id=3,ts=2,vc=75]+I[id=9,ts=3,vc=18]+I[id=2,ts=4,vc=91]+I[id=5,ts=5,vc=33]+I[id=8,ts=6,vc=67]+I[id=1,ts=7,vc=24]+I[id=10,ts=8,vc=59]+I[id=4,ts=9,vc=86]+I[id=6,ts=10,vc=11以下将根据上述输出内容做相关的SQL查询案例。

基础查询操作02

1.With子句WITHsource_with_totalAS(SELECTid,vc+10AStotalFROMsource)SELECTid,SUM(total)FROMsource_with_totalG8ROUPBYid;WITH提供了一种编写辅助语句的方法,以便在较大的查询中使用。这些语句通常被称为公共表表达式(CommonTableExpression,CTE),可以认为它们定义了仅为一个查询而存在的临时视图。WITHwith_item_definition[,...]SELECT...FROM...;with_item_defintion:with_item_name(column_name[,...n])AS(select_query)语法案例

2.SELECTWHERE子句SELECT*FROMsourceSELECTid,vc+10FROMsource自定义Source的数据SELECTid,priceFROM(VALUES(1,2.0),(2,3.1))ASt(order_id,price)SELECTvc+10FROMsourceWHEREid10SELECTselect_listFROMtable_expression[WHEREboolean_expression]语法案例

3.SELECTDSITINCT子句对于流查询,计算查询结果所需的状态可能无限增长。状态大小取决于不同行数。可以设置适当的状态生存时间(TTL)的查询配置,以防止状态过大。但是,这可能会影响查询结果的正确性。如某个key的数据过期从状态中删除了,那么下次再来这么一个key,由于在状态中找不到,就又会输出一遍。DISTINCT是SQL中用于去除查询结果中重复行的关键字,确保返回的结果集唯一。它通常用于SELECT语句,支持单列或多列去重,并可结合其他关键字(如ORDERBY、GROUPBY)使用——本质上就是根据key进行数据去重SELECTDISTINCTvcFROMsource案例

高级聚合操作03

1.分组聚合这种聚合方式,就叫作“分组聚合”(groupaggregation)。想要将结果表转换成流或输出到外部系统,必须采用撤回流(retractstream)或更新插入流(upsertstream)的编码方式;如果在代码中直接转换成DataStream打印输出,需要调用toChangelogStream()。分组聚合既是SQL原生的聚合查询,也是流处理中

文档评论(0)

一笑倾洁 + 关注
实名认证
文档贡献者

PPT课件

1亿VIP精品文档

相关文档