- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE7 / NUMPAGES8
Kafka简介
Kafka 简介
摘 要:本章节主要讲解Apache Kafka订阅消息系统,其中对Kafka的背景、什么是Kafka以及有哪些应用场景进行详细讲解。
关键词:背景;Kafka;应用场景;
1. Kafka的背景—Apache基金会的顶级项目
Kafka是最初由LinkedIn公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统
kafka作为一个消息系统,早期设计的目的是用作 LinkedIn 的活动流(Activity Stream)和运营数据处理管道(Pipeline)。
活动流数据是所有的网站对用户的使用情况做分析的时候要用到的最常规的部分,活动数据包括页面的访问量(pv)、被查看内容方面的信息以及搜索内容。这种数据通常的处理方式是先把各种活动以日志的形式写入某种文件,然后周期性的对这些文件进行统计分析。
运营数据指的是服务器的性能数据(CPU、IO 使用率、请求时间、服务日志等)。
它是由 LinkedIn 公司开发,使用 Scala 语言编写,之后成为 Apache 基金会的一个顶级项目。
2. 发布与订阅消息系统
2.1. 概念
在正式讨论Apache Kafka之前,先来了解发布与订阅消息系统的概念,并认识这个系统的重要性。数据(消息)的发送者(发布者)不会直接把消息发送给接收者,这是发布与订阅消息系统的一个特点。发布者以某种方式对消息进行分类,接收者(订阅者)订阅它们,以便接收特定类型的消息。这是一个简化的传递过程描述。发布与订阅系统一般会有一个broker,也就是发布消息的中心点。
发布与订阅消息系统的大部分应用场景都是从一个简单的消息队列或一个进程间通信开始的。比如电商系统中,包含会员模块、订单模块、商品模块、推荐模块、配送物流模块等,多个模块(子系统)间涉及消息的传递。最早的应用解决方案就是采用(子系统间)直连方式。使得很多子系统交错复杂
如下图1。
图1 (子系统间)直连
2.2. 队列系统出现
为了解决子系统间直连交错的问题,出现了队列系统。
如图2所示包含了 3 个独立的发布与订阅系统。
图2 队列系统架构3个独立的发布订阅系统
这种方式比直接使用点对点的连接要好得多,但这里有太多重复的地方。你的公司因此要为数据队列维护多个系统,每个系统又有各自的缺陷和不足。而且,接下来可能会有更多的场景需要用到消息系统。此时,你真正需要的是一个单一的集中式系统,它可以用来发布通用类型的数据,其规模可以随着公司业务的增长而增长。这时Kafka登场了。
2.3. Kafka登场
Kafka就是为了解决上述问题而设计的一款基于发布与订阅的消息系统。它一般被称为 “分布式提交日志”或者“分布式流平台”。文件系统或数据库提交日志用来提供所有事务的持久记录 ,通过重放这些日志可以重建系统的状态。同样地,Kafka的数据是按照一定顺序持久化保存的,可以按需读取。此外,Kafka的数据分布在整个系统里,具备数据故障保护和性能伸缩能力。
如图基本架构
图3 Kafka基本架构
1)Broker: kafka的服务器ID,一台机器叫一个Broker
Kafka集群包含一个或多个服务器,这种服务器被称为broker。broker端不维护数据的消费状态,提升了性能。直接使用磁盘进行存储,线性读写,速度快:避免了数据在JVM内存和系统内存之间的复制,减少耗性能的创建对象和垃圾回收。
2)Producer
是消息生成的源头,负责生产消息并发送到kafka服务器上
3)Consumer 负责消费kafka服务器上的消息
消息消费者,向Kafka broker读取消息的客户端,consumer从broker拉取(pull)数据并进行处理。
3. Kafka基本描述
消息:Kafka的数据单元被称为消息。把消息看成是数据库里的一个“数据行”或一条“记录”。消息由字节数组组成,所以对于Kafka来说,消息里的数据没有特别的格式或含义。消息可以有一个可选的元数据,也就是键(key)。键也是一个字节数组,与消息一样,对于Kafka来说也没有特殊的含义。
批次:为了提高效率,消息被分批次写入 Kafka。批次就是一组消息,这些消息属于同一个主题(topic)和分区(partition)。如果每一个消息都单独穿行于网络,会导致大量的网络开销,把消息分成批次传输可以减少网络开销。不过,这要在时间延迟和吞吐量之间作出权衡;
Kafka的消息通过主题进行分类,主题可以被分为若干个分区,消息以追加的方式写入分区。
如图4所示。
图4 主题和分区
3.1. Tpoic、Partition消息分区、Consumer Group
您可能关注的文档
- 院级-医学科研基础 医学科研选题与设计 2-青霉素提纯与产业化发展过程动画脚本.docx
- 移动商务安全 移动商务平台安全目标 AQ030201A移动商务平台的安全目标.doc
- 云安全产品配置与应用 产品配置与实践 Windows文件系统与备份恢复.docx
- 移动商务基础1 图片处理类 图像处理类APP单元案例.doc
- 云安全产品配置与应用 产品配置与实践 无线基本安全规划.docx
- 移动商务基础1 游戏类APP的运营模式及特点(以消消乐为例) 游戏类APP运营.doc
- 云存储产品配置与应用(国家) 云存储产品配置与应用(国家) FreeNAS-项目指导书27-部署基于多路径的iSCSI虚拟磁盘.docx
- 云存储产品配置与应用(国家) 云存储产品配置与应用(国家) 知识点62-ISCSI磁盘的在线扩容.doc
- 云计算应用开发 任务1 后台高级扩展文档 17.3 Eclipse+Tomcat+MAVEN+SVN项目完整环境搭建.docx
- 移动商务视觉设计2 移动商务视觉设计2 拓展阅读:如何改变淘宝图片尺寸大小.doc
- 移动应用服务器端开发(基于JSP技术)-2017 webview 实验报告:WebView.doc
- 移动应用服务器端开发(基于JSP技术)-2017 服务器端程序开发环境 实验报告:Tomcat的安装配置与测试.doc
- 轧钢机械设备维护 轧钢机械设备维护 轧钢设备课程教学设计.doc
- 移动游戏开发综合实训-2017 PS色彩运用 PS色彩运用1_PS色彩配色参考.doc
- 招投标文件编排设计 展板的内容与规范 《展板内容整理-展板的内容与规范》-室内设计方案资料归档的规范-教案.docx
- 移动游戏开发综合实训-2017 界面设计 界面设计2_卡牌界面概念设计.doc
- 招投标文件编排设计 展板的内容与规范 《展板内容整理-展板的内容与规范》-展板内容的整理图文处理-教案.docx
- 移动游戏开发综合实训-2017 裸模布线 裸模布线.doc
- 乙烯生产操作与控制 8、其他工作 企业简介.doc
- 正常人体结构 任务五 神经组织 神经组织教案.doc
原创力文档


文档评论(0)