2025年软件行业运维部运维工程师监控告警手册.docx

2025年软件行业运维部运维工程师监控告警手册.docx

2025年软件行业运维部运维工程师监控告警手册

第1章基础设施与网络连通性监控

1.1核心服务器资源状态监测

需利用Linux`top`和`htop`命令实时查看CPU使用率与内存占用情况,重点关注`CPUTIME`列中的`system`和`user`占比,若系统级CPU占用超过90%且`user`占比异常升高,通常意味着进程调度混乱或进程卡死。接着,通过`free-h`命令检查物理内存与交换空间(Swap)的分配比例,若物理内存使用率长期超过85%且Swap使用率接近100%,说明系统已耗尽物理内存,必须立即扩容或清理无用进程

文档评论(0)

1亿VIP精品文档

相关文档