TDH大数据平台培训_第06讲_分布式数据采集工具Flume.pdfVIP

TDH大数据平台培训_第06讲_分布式数据采集工具Flume.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TDH大数据平台培训_第06讲_分布式数据采集工具Flume

分布式数据采集工具Flume 范 颖 捷 | 2018.04 星 环 科 技 星 环 科 技 1 Flume简介 目录 2 Flume原理 CONTENTS 3 Flume使用 1 chapter Flume简介  什么是Flume  Flume使用场景 1.1 什么是Flume Flume简介  Flume是一个分布式海量日志采集、聚合和传输系统  基本特点 • 高可用 • 基于事件的海量数据采集 • 数据流模型:Source-Channel-Sink • 事务机制保证消息传递的可靠性 • 内置丰富插件,轻松与各种外部系统集成 • Java实现,开源,优秀的系统设计 星 环 科 技 1.2 Flume使用场景 Flume简介 星 环 科 技 2 chapter Flume原理  基本概念  Flume基本组件  Flume数据流  Flume架构 2.1 基本概念 Flume原理  Event :事件,最小数据传输单元,由Header和Body组成  Agent :代理,JVM进程 ,最小运行单元,由Source、Channel、Sink三个基本组件构成, 负责将外部数据源产生的数据以Event的形式传输到目的地 • Source:负责对接各种外部数据源,将采集到的数据封装成Event ,然后写入Channel • Channel :Event暂存容器,负责保存Source发送的Event ,直至被Sink成功读取 • Sink:负责从Channel读取Event ,然后将其写入外部存储,或传输给下一阶段的Agent • 映射关系:1个Source  多个Channel ,1个Channel  多个Sink,1个Sink  1个Channel 星 环 科 技 2.2 Flume基本组件 Flume原理  Source组件 • 对接各种外部数据源,将采集到的数据封装成Event ,然后写入Channel • 一个Source可向多个Channel发送Event •Flume 内置类型丰富的Source,同时用户可自定义Source 类型 Type (参数) 说明 Exec Source exec 监听Linu

文档评论(0)

苏醒文档集 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档