- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
【概述】
ApacheKafka是一个分布式的消息发布-订阅系统。可以说,任何实时大数据处理工具缺少与
Kafka整合都是的。本文将介绍如何使用SparkStreaming从Kafka中接收数据,这里将会介绍
两种方法:(1)、使用Receivers和Kafka次的API;(2)、使用DirectAPI,这是使用低层
次的KafkaAPI,并没有使用到Receivers,是Spark1.3.0中开始引入的。这两种方法有不同的编程
模型,性能特点和语义担保
【基于Receivers的方法】
这个方法使用了Receivers来接收数据。Receivers的实现使用到Kafka次的消费者API。
对于所有的Receivers,接收到的数据将会保存在Sparkexecutors中,然后由SparkStreaming
启动的Job来处理这些数据。
然而,在默认的配置下,这种方法在失败的情况下会丢失数据,为了保证零数据丢失,你可
以在SparkStreaming中使用WAL日志,这是在Spark1.2.0才引入的功能,这使得我们可以将接收
到的数据保存到WAL中(WAL日志可以在HDFS上),所以在失败的时候,我们可以从WAL中恢
复,而不至于丢失数据。
下面,我将介绍如何使用这种方法来接收数据。
1、引入依赖。
对于Scala和Java项目,你可以在你的pom.xml文件引入以下依赖:
dependency
groupIdorg.apache.spark/groupId
artifactIdspark-streaming-kafka_2.10/artifactId
version1.3.0/version
【概述】
ApacheKafka是一个多元化的消息发布‑订阅系统。可以说,任何实时大数据处理工具缺少与
Kafka集是的。本文将介绍如何使用SparkStreaming从Kafka中接收数据,这里将
介绍两种方法:(1)、使用Receivers和Kafka次的API;(2)、使用DirectAPI,这是使用低层
次的KafkaAPI,并且没有使用到Receivers,是Spark1.3.0这两种方法有不同的编程模型、性能
特征和语义模型
【基于接收者的方法】
这个方法使用了Receivers来接收数据。Receivers的实现使用到Kafka次的Consumer
API。对于所有的Receivers,接收到的数据将保存在Spark执行器中,由SparkStreaming启动然后
Job来处理这些数据。
不过,在默认的配置下,这种方法在失败的情况下会丢失数据,为了保证零数据丢失,你可以在
SparkStreaming中使用WAL日志,这是在Spark1.2.0才引入的功能,这使得我们可以将接收到的数
据保存到WAL中(WAL日志可以在HDFS上),所以在失败的时候,我们可以从WAL中恢复,
而不至于丢失数据。
下面,我将介绍如何使用这种方法来接收数据。
1、引入依赖。
对于Scala和Java项目,您可以在您的pom.xml文件中引入以下依赖:
依赖项
groupIdorg.apache.spark/groupId
artifactIdspark‑streaming‑kafka_2.10/artifactId
版本1.3.0/版本
/dependency
如果你是使用SBT,可以这么引入:
libraryDependencies+=org.apache.spark%spark-streaming-kafka_2.10%1.3.0
编程
在Streamin
您可能关注的文档
- 2025授权英文合同范本.docx
- 2025农业银行借款合同范本.docx
- 2025关于石油销售居间的合同范本.docx
- 2025租赁合同的约定事项.docx
- 2025农业银行外汇借款合同模板.docx
- 大学生反诈安全知识竞赛学习复习卷含答案.docx
- 大学毛概考试试题答案.docx
- 2025精简版食品采购合同范文.docx
- 2025秘方转让合同.docx
- 2025综合劳动合同样本(不包括少数民族职工内容).docx
- 2025年中国CD拷贝机数据监测研究报告.docx
- 2025年中国多环电极砼电阻率测试仪数据监测研究报告.docx
- 2025年中国PP透明工具盒数据监测研究报告.docx
- 2025年及未来5年中国微机防误闭锁操作系统市场分析及数据监测研究报告.docx
- 2025年及未来5年中国吹塑壶市场分析及数据监测研究报告.docx
- 2025年事业单位工勤技能-四川-四川广播电视天线工三级(高级工)历年参考题典型考点含答案解析.docx
- 2025年中国恒压弹簧数据监测研究报告.docx
- 2025年中国免掏空对接头数据监测研究报告.docx
- 2025年中国高清连接线数据监测研究报告.docx
- 2025年中国三基色管数据监测研究报告.docx
最近下载
- 建筑地面工程施工质量验收规范,gb50209-2010 .pdf VIP
- 2025年全国文明单位考核测评标准.pdf VIP
- 期末考试奖状一奖状.doc VIP
- 《安全色和安全标志GB2894-2025》新旧版对比学习丨41页.pptx
- 喜剧的十三种结构.pdf VIP
- 大学生《物理化学》9套期末考试试卷(含答案).pdf VIP
- 5313A-2017 电磁辐射暴露限值和测量方法.pdf VIP
- 广东省深圳市南山区深圳市南山外国语学校(集团)科华学校2023-2024 学年四年级上学期阶段性学情调研期中数学试卷.pdf VIP
- 血管通路护理专科门诊建设与服务规范.docx VIP
- HCIA-IOT 物联网 H12-111 V3.0认证培训考试题库大全-上(单选题汇总) .docx VIP
原创力文档


文档评论(0)