云原生运维代理平台(四)讲师:胤禛-YinZhen开放式云平台架构
01.云原生运维代理平台架构目录
01.云原生运维代理平台架构对所有收集的数据都要进行清洗操作,去除没有用的或者是杂音的数据以便提高来源数据的质量,随后大数据平台处理时得到的结果的质量才能得到更好的保证。数据的清洗采用的是Pulsar的ETLfunctions。Pulsar提供一种可以编排的function能力,它可以通过Pulsar消息服务的Topic抽取数据、加工数据再将处理结果转存到其他Topic中。我们利用Pulsarfunctions这种能力来实现ETL(数据抽取、清洗处理、加载等过程的简称)。有关Pulsarfunctions如何使用,请读者自行阅读相关材料。我们这里关心的是如何设计这个ETL的逻辑。有关COAP的ETL逻辑设计,数据清洗的目的可以从两个角度上看,一是为了解决数据质量问题,二是让数据更适合做挖掘。不同的目的下分不同的情况,也都有相应的解决方式和方法。整体思路如图。
01.云原生运维代理平台架构数据采集端(FileBeat或者其他装置)将数据源源不断的发送到OPS主题中(Pulsar此时采用的是无界数据流模式),此时质量过滤function负责对数据内容进行清洗操作:?质量过滤function:根据过滤指标的配置,我们从这几个方面过滤数据,只有符合标准的数据才能流入下
您可能关注的文档
最近下载
- 船舶图纸与技术文件送审控制要点.docx VIP
- 2025年高考(河北卷)历史真题(学生版+解析版).docx
- 班级管理(第3版)张作岭课后习题答案.docx VIP
- LC_20AD液相色谱仪(JQ_849)确认方案.doc VIP
- 2026上海市闵行区区管国企招聘42人备考题库及答案详解(易错题).docx VIP
- 住建部检查建设工程施工质量检查表.pdf VIP
- 人教版二年级下册字帖(打印版).docx VIP
- 数字电路与系统第四版唐洪答案.docx VIP
- 中医健康管理技术(康复理疗方向)考试复习题库资料(含答案).pdf VIP
- 下肢深静脉血栓形成介入治疗专家共识2026.pptx VIP
原创力文档

文档评论(0)