TDH大数据平台实验_09_Slipstream流处理过程.pdfVIP

TDH大数据平台实验_09_Slipstream流处理过程.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TDH大数据平台实验_09_Slipstream流处理过程

平台认证数据工程师培训 课堂实验 一、基本信息 文档编号 文档版本 1.0 实验名称 Slipstream 流处理过程 所属课程 第13 讲 实时流处理引擎Slipstream 认证等级 数据工程师 (初级) 授课形式 上机实验 实验批次 第9 次 / 共11 次 二、实验目的  掌握StreamSQL 使用方法。  掌握Slipstream 流处理的基本过程。  理解输入流表、衍生流表、结果表和流任务的关系。 三、实验准备  安装Waterdrop ,StreamSQL 语句在Waterdrop 中运行。  同组学员可同时开展实验,数据库、Kafka Topic、流表都以学员姓名拼音为后缀,例如: db_zhangsan、accesslog_zhangsan 。 四、实验内容 1、创建Kafka Topic  任务:创建Kafka Topic ,作为输入流表的数据源。  步骤 Linux : // 切换到Kafka bin 目录 1. cd {TDH_Client 路径}/kafka/bin // 创建Kafka Topic ,分区数为4 ,副本数为2 2. ./kafka-topics.sh --create --topic accesslog_zhangsan --zookeeper tdh-85:2181,tdh-86:2181, tdh-87:2181 --partitions 4 --replication-factor 2 // 查看Topic 是否创建成功 3. ./kafka-topics.sh --list --zookeeper tdh-85:2181,tdh-86:2181,tdh-87:2181 1 平台认证数据工程师培训 2 、创建输入流表  任务:基于Kafka Topic 创建输入流表。  步骤 SQL: // 基于Kafka Topic 创建输入流表accesslog_zhangsan 1. create stream accesslog_zhangsan(ip string, url string, time timestamp) row format delimited fields terminated by , tblproperties( topic=accesslog_zhangsan, kafka.zookeeper=tdh-85:2181,tdh-86:2181,tdh-97:2181, kafka.broker.list=tdh-85:9092,tdh-86:9092,tdh-87:9092); 3 、创建衍生流表  任务:基于输入流表创建衍生流表。  步骤 SQL: // 基于输入流表创建衍生流表waccesslog_zhangsan ,窗口Length 和Slide 为10 秒 1. create stream waccesslog_zhangsan as select * from accesslog_zhangsan streamwindow sw as (length 10 second slide 10 second); 4 、创建结果表  任务:创建Inceptor 结果表,用于存储流处理的结果。  步骤 SQL: // 创建Inceptor 表,用于存储流处理结果 1. use db_zhangsan; 2. create table result(url string, count int); 5 、启动流任务  任务:将基于衍生流的统计结果写入Inceptor 结果表,该操作启动流任

文档评论(0)

苏醒文档集 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档