从零搭建一个基于 ELK 的日志、指标收集与监控系统.docxVIP

从零搭建一个基于 ELK 的日志、指标收集与监控系统.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从零搭建一个基于 ELK 的日志、目标收集与监控系统 在当前的项目中,我们已经使用了 Elasticsearch 作为业务的数据储存,同时利用 ansible、docker、jenkins 组合了一套快速部署的工具。在配置好需要部署主机的 ssh 连接信息后,我们可以通过 jenkins 一键部署一个 Elasticsearch 和 Kibana。 这套系统遵照以下的设计准绳: Self-Contained Deployment:我们把全部的部署脚本、配置文件、Jenkins 任务都打包到一个标准化的 Jenkins docker 包中,只需安装到目标的环境上,即可把全部部署所需的工具都一次性带入。 Single Source of Truth:在 Jenkins 中内嵌一个 yaml 格式的配置文件管理器,对于全部部署需要依靠的变量进行统一管理,例如 xx 系统后端对外暴露的端口号,只在 Jenkins 中配置一次,全部的脚本都会自动读取该变量。 Configuration as Code, Infrastructure as Code:当全部的配置确定下来后,后续的流程理论上是可以做到全自动化的,所以全部的安装都通过脚原来完成。 需求分析 在私有化部署的环境中,日志的收集使用有几个特点: 需要能快速部署。由于客户的数量较多,我们需要能快速地部署监控系统,监控系统本身的运维压力需要较小。 部署组件要简约,且健壮性强。由于部署环境较为简单,期望每个组件本身是健壮的,同时组件之间的交互尽量简约,避开简单的网络拓扑。 功能性优于稳定性。由于日志和目标信息本身在宿主主机和应用上是有副本的,所以即时监控系统的数据丢失了,影响也不大。但是假如系统能供应更多强大的功能,对于分析是很有挂念的。 功能要求不高。由于私有化环境对接系统的容量和简单度可控,可以使用单机部署,同时查询慢一些也没关系。 同时需要满足几个需求: 需要能采集分布式的日志,并且集中式地查看。 需要能采集机器的基本信息,例如 CPU、磁盘,并进行监控。 最好能采集应用的数据,例如导入数据的条目数,并进行监控。 最好能实现特别目标的告警功能。 方案分析 方案上有 3 个备选方案: 利用 ELK?(Elasticsearch、Logstash、Kibana) 做全体的监控基础组件,同时使用 Elastic 新推出的 beat 系列作为采集工具。 利用 Zabbix、Open-Falcon?等运维监控工具进行系统基础组件的监控。同时利用自定义目标,进行数据的监控和告警。 利用 TICK?(Telegraph、InfluxDB、Chronograf、Kapacitor) 做全体的监控基础组件。 目前日志方面能比较好满足需求的只要开源的 ELK 和商业化的 Splunk,假如 Splunk 的授权费是预算可接受的,也可以使用方案 2、3 结合 Splunk 的方式来实现。但是目前来看 Splunk 昂扬的授权费并不是大部分公司可以接受的。方案 2 和 3 在需求上不能很好满足日志的收集和查看功能,所以排解掉了。 方案 1(ELK) 依据我们的需求进一步细化: 需要能快速部署:通过我们的 Jenkins 可以实现一键部署的功能。 部署组件简约:我们只部署 Elasticsearch 和 Kibana 组件,同时 Elasticsearch 本身作为最基础的组件是自包含的,不依靠任何外部组件。而我们也不使用集群,只用单机部署,保证 Elasticsearch 部署的简约和稳定。 功能性优于稳定性:虽然业务使用的 Elasticsearch 停留在 5.5.3 版本,我们日志采集和分析使用的 Elasticsearch 直接升级到 7.6.0 版本,同时后续的版本升级也可以较为激进,假如遇到不兼容的情况,也不需要保留已有数据,删除数据重新部署即可。 功能要求不高:使用单机部署,Elasticsearch 和 Kibana 部署在同一台机器上。 日志公用的 Elasticsearch、Kibana、Beat 为了避开日志使用的 ES 和业务使用的 ES 在资源或者配置上发生冲突,日志公用的 ES 单独做了一个部署,使用约 3G 内存。 日志采集: 我们在全部相关主机上使用 ansible 部署 filebeat 进行日志的采集,为了简化系统,我们也没有使用 logstash 做日志的预处理,只是简约地配置了 filebeat 的配置文件,并加入了我们的 jenkins 一键部署套件中。 日志的查看: 由于日志直接通过 filebeat 收集到了 es 中,我们使用 Kibana 就能直接进行查看了。 系统目标收集: 我们在全部相关主机上使用 ansible 部署 metricbeat 进行目标

文档评论(0)

bob157641554 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档