参考应用尚硅谷spark04 streaming.pptx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

SparkStreaming

应用解析讲师:武玉飞

课程内容SparkStreaming是什么东西SparkStreaming要学什么SparkStreaming的关键抽象SparkStreaming小试SparkStreaming输入SparkStreaming转换SparkStreaming输出

SparkStreaming是什么

SparkStreaming有什么特点

SparkStreaming要学什么SparkStreaming的输入SparkStreaming的输出SparkStreaming的转换-无状态转换-有状态转换

SparkStreaming关键抽象SparkCoreSparkSQLRDDDataFrameDataSetSparkStreamingDStreamDStream:DiscretizedStream

SparkStreaming关键抽象DStream:DiscretizedStream离散化流

SparkStreaming整体架构

SparkStreaming整体架构

SparkStreaming背压机制

SparkStreaming的入口StreamingContextvalconf=newSparkConf().setAppName(appName).setMaster(master)

valssc=newStreamingContext(conf,Seconds(1))

//可以通过ssc.sparkContext来访问SparkContext

//或者通过已经存在的SparkContext来创建StreamingContext

valsc=...

valssc=newStreamingContext(sc,Seconds(1))初始化完Context之后:定义消息输入源来创建DStreams.定义DStreams的转化操作和输出操作。通过streamingContext.start()来启动消息采集和处理.等待程序终止,可以通过streamingContext.awaitTermination()来设置通过streamingContext.stop()来手动终止处理程序。

SparkStreaming牛刀小试StreamingWordCount:对源源不端的流式数据进行单词统计

Dstream的输入Dstream输入文件数据源RDD队列自定义数据源ApacheKafkaFlume-ng

Kafka

Kafka

Kafka

Kafka

Dstream的转换Dstream转换无状态转换有状态转换

Dstream的输出Dstream输出数据打印数据保存foreachRDD

文档评论(0)

ericxiao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档