- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Ryan Weald:Spark流媒体产品化
Productionalizing
Spark Streaming
Spark Summit 2013
Ryan Weald
@rweald
@rweald
What We’re Going to Cover
•What we do and Why we choose Spark
•Fault tolerance for long lived streaming jobs
•Common patterns and functional abstractions
•Testing before we “do it live”
@rweald
Special focus on
common patterns and
their solutions
@rweald
What is Sharethrough?
Advertising for the Modern Internet
Form Function
@rweald
What is Sharethrough?
@rweald
Why Spark Streaming?
@rweald
Why Spark Streaming
•Liked theoretical foundation of mini-batch
•Scala codebase + functional API
•Young project with opportunities to contribute
•Batch model for iterative ML algorithms
@rweald
Great...
Now productionalize it
@rweald
Fault Tolerance
@rweald
Keys to Fault Tolerance
1.Receiver fault tolerance
2.Monitoring job progress
@rweald
Receiver Fault Tolerance
•Use Actors with supervisors
•Use self healing connection pools
@rweald
Use Actors
class RabbitMQStreamReceiver (uri :String, exchangeName: String,
routingKey: String) extends Actor with Receiver with Logging {
implicit val system = ActorSystem()
override def preStart() = {
//Your code to setup connections and actors
//Include inner class to process messages
}
def receive: Receive = {
case _ = logInfo(unknown message)
}
}
@rweald
Track All Outputs
•Low watermarks - Google MillWheel
•Database updated_at
•Expected output file size alerting
@rweald
Common Patterns
您可能关注的文档
- Primavera_P6单机版完美安装指南(SYSU版).pdf
- presscad2000设计教材.pdf
- Proe Top-Down自顶向下设计小讲.pdf
- ProE野火版TOOLKIT二次开发入门与进阶(测试版3.0).pdf
- Proe快速入门第4天.pdf
- protel_dxp高级教程.pdf
- PreSonus StudioLive 16.4.2 数字调音台 StudioLive 软件库参考中文手册2-1.pdf
- ProfileMaker操作指南(上海运安制版有限公司装饰分公司).pdf
- protel信息单元 1 原理图库操作(OK).pdf
- protel信息单元4 PCB库操作(OK).pdf
- 新高考生物二轮复习讲练测第6讲 遗传的分子基础(检测) (原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第3讲 酶和ATP(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第8讲 生物的变异、育种与进化(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(检测)(原卷版).docx
文档评论(0)