网络系统建设与运维初级 6.2 网络系统维护与故障处理.pptxVIP

  • 4
  • 0
  • 约6.82千字
  • 约 33页
  • 2025-01-24 发布于浙江
  • 举报

网络系统建设与运维初级 6.2 网络系统维护与故障处理.pptx

第0页

1.维护概述

2.例行维护

3.故障处理

目录

第1页

·网络运维也叫运维管理(OperationAdministrationandMaintenance,OAM)。

口Maintennance——维护,包括例行维护和故障维护

例行维护:网络进行例行检查与维护,以消除设备的运行隐患

故障处理:故障处理则指在网络出现故障时对网络进行应急处理的过程

维护概述

第2页

·运维人员在进行网络维护时必须遵循以下注意事项:

口发生故障时请先评估是否为紧急故障,是紧急故障请使用预先制定的紧急故障处理方法尽快恢复故障模块,进而恢复业务。

口严格遵守操作规程和行业安全规程,确保人身安全与设备安全。

口更换和维护设备部件过程中,要做好防静电措施,佩戴防静电腕带。

。在故障处理过程中遇到的任何问题,应详细记录各种原始信息。

口所有的重大操作,如重启设备、擦除数据库等均应作记录,并在操作前仔细确认操作的可行性,在做好相应的备份、应急和安全措施后,方可由有资格的操作人员执行。

维护概述

第3页

1.维护概述

2.例行维护

3.故障处理

目录

第4页

·例行维护的目的是通过日常的例行维护发现并消除设备的运行隐患,主要包括以下内容:

设备环境检查

口设备基本信息检查

□设备运行状态检查

□接口内容检查

口业务检查

例行维护

第5页

·设备运行环境检查

设备运行环境正常是保证设备正常运行的前提,日常例行维护过程中,要定期检查机房温度、湿度、空调运行状态、供电状况等。

温度:0~40℃

口湿度:机房相对湿度(RH):5%~90%

空调运行状态:可持续、稳定,确保温度、湿度状态正常

□供电情况:供电系统、接地方式、防雷状况、安装规范性

□其他:清洁状况、酸碱状况等

例行维护

第6页

·设备基本信息检查

设备基本信息检查,主要检查设备的软件版本、License许可、补丁信息、系统时间等是否正确。

□软件版本:PCB版本、软件版本、启动加载软件包等

License信息:GTLLicense文件名、版本及配置项,主控板License状态等

□补丁信息:补丁信息是否最新

系统时间:系统时间设置是否准确

其他:存储空间检查、设备信息中心,debug开关,是否保存,连通性等

例行维护

第7页

·设备运行状态检查

设备运行状态检查,主要检查设备的单板运行状态、设备复位情况、设备温度等是否正常。口单板运行状态:板块是否在线,状态是否正常

口设备复位状态:复位时间,复位原因,有无异常复位等

□CPU、内存占用状态:CPU占用小于80%,内存小于60%

□告警信息、日志信息

其他:温度状态、风扇状态、电源状态等

例行维护

第8页

·接口内容检查

常见的接口内容检查包括检查协商模式、端口配置、端口状态等信息。口接口错包:有无CRC等错包

口接口配置:双工模式、速率、协商模式、环回配置等是否正确口接口状态:接口物理状态是否满足要求

口POE供电:支持POE供电的接口状态是否正常

。接口统计数据:接口统计数据有无异常增长

例行维护

第9页

·业务检查

业务检查主要检查包括IP业务、组播、路由等业务是否正常。

□IP流量统计

·单次采集的错包和TTL超时报文数小于100。

·正常情况下,两次采集的错包数和TTL超时报文数没有增长口ICMP流量统计

■destinationunreachable和redirects项不超过100

例行维护

第10页

1.维护概述

2.例行维护

3.故障处理

目录

第11页

·基本思路

故障的所有可能原因缩减或隔离成几个小的子集,从而使问题的复杂度迅速下降。

·基本步骤

观察现象、收集信息、判断分析、原因排查

·三个阶段

口故障信息采集阶段

□故障定位与诊断阶段

□故障修复阶段

故障处理

第12页

·故障信息采集阶段

在发生业务故障时,首先应该收集故障相关的信息,需要收集的故障信息包括如下内容。

口发生故障的时间、故障点的网络拓扑结构(例如故障设备连接的上下游设备、所处的网络位

置)、导致故障的操作、故障后已采取的措施和结果、故障现象和影响的业务范围(例如故障导致哪些端口的哪些业务不正常)等。

口发生故障的设备的名称、版本、当前配置、接口信息等。

口发生故障时产生的日志信息。

故障处理

第13页

·故障信息采集阶段

故障信息采集一般通过两种方式获取。

□通过【display】命令

·【display】命令是网络维护和故障处理的重要工具,可用于了解设备的当前状况、检测相邻设备、总体监控网络、定位网络故障等

□通过查看设备日志和告警信息。

·设备发生故障时,系统会自动生成一些系统日志和告警信息,搜集分析这些信息有助于用

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档