- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
山西职业技术学院《Hadoop大数据技术与项目实战》
拦截器创建流程
一、任务描述
编写Flume自定义拦截器,创建ETL拦截器LogETLInterceptor类、分流标记拦截
器LogTypeInterceptor类和LogUtils工具类。
ETL拦截器的功能是建立一个List集合,对每一个事件通过调用LogUtils工具类进
行判断,筛选出启动日志和事件日志,添加到集合中。
分流标记拦截器的功能是建立一个List集合,对ETL拦截器过滤出的启动日志添加
{“topic”,“topic_start”}的头部信息,对事件日志添加{“topic”,“topic_event”}的头部信息,再
将结果添加到集合中。
LogUtils工具类的功能是判断获取到的日志是启动日志还是事件日志。
二、能力目标
1.理解Flume拦截器的作用
2.会编写Flume拦截器程序
三、任务准备
1.IDEA开发软件
2.Xshell、Xftp软件
四、任务实施
1.创建项目
双击启动IDEA软件,启动成功后单击NewProject,创建新项目。
1
山西职业技术学院《Hadoop大数据技术与项目实战》
在弹出的新项目框中,选择Maven项目,单击Next按钮,
在弹出的新项目框中,设置项目名称Name为OfflineDataWarehouse_FlumeInterce
ptor;设置项目存储位置Location为D:\Project\OfflineDataWarehouse_FlumeIntercept
2
山西职业技术学院《Hadoop大数据技术与项目实战》
or;单击ArtifactCoordinates下拉菜单,设置项目组织标识符GroupId为com.bigdata,
设置项目标识符ArtifactId为OfflineDataWarehouse_FlumeInterceptor,单击Finish按
钮,完成项目的创建,等待IDEA启动生成项目。
项目生成后,首先需要在pom.xml文件中引入Flume相关依赖,完整内容如下:
?xmlversion=1.0encoding=UTF-8?
projectxmlns=/POM/4.0.0
xmlns:xsi=/2001/XMLSchema-instance
xsi:schemaLocation=/POM/4.0.0http://maven.apac
/xsd/maven-4.0.0.xsd
modelVersion4.0.0/modelVersion
groupIdcom.bigdata/groupId
artifactIdOfflineDataWarehouse_FlumeInterceptor/artifactId
version1.0/version
3
山西职业技术学院《Hadoop大数据技术与项目实战》
properties
project.build.sourceEncodingUTF-8/project.build.sourceEncoding
project.reporting.outputEncodingUTF-8/project.reporting.outputEncodin
g
java.version1.8/java.version
/properties
dependencies
dependency
groupIdorg.apache.flume/gr
您可能关注的文档
- Hadoop大数据技术与项目实战 教案 模块2 大数据平台部署.docx
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.2 Sqoop数据迁移实训指导书.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.1 pyecharts可视化工具介绍.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.2 导入数据、绘制大屏标题.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.4 绘制象形柱状图、水球图.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 5.3.7 数据大屏展示.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 辅助实训指导书——导入uzet.sql数据库文件至虚拟机数据库.pdf
- Hadoop大数据技术与项目实战 实训指导书及代码资源 模块5 项目数据可视化展示.pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.4 绘制象形柱状图(沉默用户数).pdf
- Hadoop大数据技术与项目实战 实训指导书1——5.3.7 安装bs4第三方库.pdf
- 九年级下册 第四单元 写作《修改润色》 同步优质课件(共41张PPT).pptx
- 2025年黑龙江华润酒精有限公司校园招聘模拟试题附带答案详解完整.docx
- 扬州中学2024-2025学年高一下学期3月月考语文试题(含答案).pdf
- 南京市六校联合体2024-2025学年高二下学期3月联合调研政治试题.pdf
- 南京航空航天大学附属高级中学2024-2025学年高二下学期3月月考化学试题.pdf
- 南京、镇江、徐州联盟校2024-2025学年高二下学期3月月考英语试题.pdf
- 南京市第一中学2024-2025学年高二下学期3月月考地理试题.docx
- 扬州市第一中学2024-2025学年高一下学期3月月考英语试题.pdf
- 南京市第二十九中学2023-2024学年高一3月月考历史试题.docx
- 南京市六校联合体2024-2025学年高一下学期3月调研测试政治试卷.docx
最近下载
- 2024-2025学年高中信息技术粤教版(2019)必修2 信息系统与社会教学设计合集.docx
- Unit 2 How often do you exercise教学设计-2024-2025学年人教版英语八年级上册.docx
- 手术体位的摆放原则与注意事项.pptx VIP
- 2025成人肥胖食养指南(完整版) .pdf VIP
- 新22J02 屋面参考图集.docx VIP
- HG-T 2198-2011 硫化橡胶物理试验方法的-般要求.pdf VIP
- TCRES 0017-2023 压缩空气储能电站能效测量技术导则.pdf
- 肿瘤浸润淋巴细胞制品产品技术标准2023年.pdf VIP
- 办公家具项目实施方案、供货方案.docx
- 60.地质灾害拦石墙工程设计规范(试行)-T CAGHP 060-2019.pdf
文档评论(0)