服务器运行状态与维护自查报告.docxVIP

  • 1
  • 0
  • 约5.12千字
  • 约 12页
  • 2026-06-03 发布于四川
  • 举报

服务器运行状态与维护自查报告

第一章运行基线采集与量化

1.1采集范围

CPU利用率、内存利用率、磁盘I/O延迟、网络吞吐、TCP重传率、进程僵尸数、硬件传感器温度、电源功耗、RAID电池状态、BMC日志、系统日志、应用日志、安全日志、容器指标、虚拟机指标、中间件队列深度、数据库QPS/TPS、缓存命中率、SSL证书有效期、域名解析耗时、CDN回源耗时、备份窗口时长、补丁级别、漏洞评分。

1.2采集工具与频率

node_exporter+Prometheus:15s拉取一次;

iostat/sar:每10s写入tsdb;

smartctl:每30min轮询磁盘SMART;

ipmitool:每5min抽取SEL;

auditbeat:实时内核事件;

filebeat:日志1s内落盘;

mysqld_exporter:5s一次;

自定义shell探针:证书、域名、CDN每日02:00探测;

所有指标保留90天,冷数据压缩后转存CephS3,生命周期3年。

1.3基线计算

取过去4周同一时段95分位值作为“动态基线”,超出15%触发Warning,超出30%触发Critical;新上线主机前3天采用“同配置类比法”,取同型号、同业务、同负载主机的95分位值作为临时基

文档评论(0)

1亿VIP精品文档

相关文档