- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TDH大数据平台实验_06_Flume使用方法
平台认证数据工程师培训
课堂实验
一、实验信息
文档编号 文档版本 1.0
实验名称 Flume 使用方法
所属课程 第6 讲 分布式数据采集工具Flume 认证等级 数据工程师 (初级)
授课形式 上机实验 实验批次 第6 次 / 共11 次
二、实验目的
掌握Flume 的安装、配置和运行。
理解Flume Agent 及其组件的基本功能。
三、实验准备
通过Flume 官网下载Flume 1.7.0 安装包。
实验目录规划 (zhangsan 代表学员姓名)
(1)本地目录:mnt/disk1/zhangsan ;
(2 )Flume 的本地监听目录:/mnt/disk 1/zhangsan/flumeSpool;
(3 )Flume 的HDFS 存储目录:/tmp/zhangsan/flume_data/ 。
四、实验内容
1、安装Flume
任务:将Flume 安装包复制到集群服务器中,并解压。
步骤
Linux :
// 登录文件服务器,进入Flume 安装包存储目录,将安装包复制到集群服务器中
1. ssh root@172.16.140.111
2. cd /mnt/disk1/de_traning
3. scp apache-flume-1.7.0-bin.tar.gz 172.16.140.85:/mnt/disk1/zhangsan
// 登录集群服务器,进入Flume 安装包存储目录,解压Flume 安装包
4. ssh root@172.16.140.85
5. cd /mnt/disk1/zhangsan
1
平台认证数据工程师培训
6. tar -xzvf apache-flume-1.7.0-bin.tar.gz
2、配置Flume
任务:编辑Flume 配置文件(conf/flume.conf ),设置source 类型为spooldir、sink 类型为
hdfs 、channel 类型为memory。
步骤
Linux :
// 进入Flume 安装目录,编辑flume.conf
1. cd /mnt/disk1/zhangsan/apache-flume-1.7.0-bin
2. vim /conf/flume.conf
flume.conf :
// 定义Agent 组件名
a1.sources = r1
a1.sinks = k1
a1.channels = c1
// 配置Souce 组件
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /mnt/disk 1/zhangsan/flumeSpool
a1.sources.r1.fileHeader = true
// 配置Sink 组件
a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
a1.sinks.k1.hdfs.path = /tmp/zhangsan/flume_data/
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = minute
// 配置Channel 组件
a1.channels.c1.type = memory
a1.channels.c1.capacity = 5000
a1.channels.c1.transactionCapacity
您可能关注的文档
- TDH大数据平台培训_第02讲_分布式文件系统HDFS.pdf
- TDH大数据平台培训_第03讲_分布式资源管理框架YARN.pdf
- TDH大数据平台培训_第04讲_分布式计算框架.pdf
- TDH大数据平台培训_第05讲_分布式ETL工具Sqoop.pdf
- TDH大数据平台培训_第06讲_分布式数据采集工具Flume.pdf
- TDH大数据平台培训_第07讲_分布式消息队列Kafka.pdf
- TDH大数据平台培训_第08讲_星环大数据产品介绍_V4.0.pdf
- TDH大数据平台培训_第09讲_TDH平台的软硬件环境要求.pdf
- TDH大数据平台培训_第10讲_TDH集群的角色分配.pdf
- TDH大数据平台培训_第11讲_分布式SQL引擎Inceptor.pdf
最近下载
- 最新时事政治必考试题库及答案详解【全国通用】.docx VIP
- 2025时事政治必考试题库(考点梳理)附答案详解.docx VIP
- 时事政治必考试题库及(2025年)及答案详解【考点梳理】.docx VIP
- 《中华人民共和国危险化学品安全法》解读及宣传培训.pptx VIP
- 阿特拉斯•科普柯 冷冻式干燥机.pdf VIP
- 2022-2023学年广东省中山市八年级(上)期末物理试卷(含答案).pdf VIP
- 2025年时事政治热点题库考试试题库及答案详解【考点梳理】.docx VIP
- GB∕T 39549-2020 纤维增强热固性复合材料化粪池(可复制版).pdf
- 2025年时事政治必考题库及答案详解(考点梳理).docx VIP
- 专题01++机械运动(期末复习课件)八年级物理上学期新教材人教版.pptx VIP
原创力文档


文档评论(0)