ewsd紧急情况处理培训教材(综合).ppt

  1. 1、本文档共180页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
欢迎参加 EWSD紧急情况培训! EWSD紧急情况处理培训 紧急情况的定义 紧急情况的处理 紧急情况的基本定义 大量用户(V9:50%用户)不能通话 大量中继(V9:30%中继)不能使用 两个硬盘的APS都不可用 可能是紧急情况的症状 因整个系统崩溃而无法访问系统(循环Recovery状态) CP使用DISK上的GEN做RECOVERY(NSTART0-3和ISTART1/2)都不成功,并自动进入呼叫处理基本模式(CALL PROCESSING BASIC MODE) CP选用一个BACKUP或GOLDEN GEN做ISTART2G 呼叫处理继续保持,但不能访问任何磁盘,此时AMA已不能保留在DISK,很多MML不执行 MB、TSG、SSG掉电,或双侧UNA 可能是紧急情况的症状 系统对终端输入没有反应或所有的电话没有拨号音。 对象为“CENTRAL UNITS”的紧急告警。这有可能指示出双硬盘故障。 对象为“RECOVERY”的紧急告警。这有可能指示出ISTART2G。 对象为“SYP”的紧急告警。这有可能指示CP进入了呼叫处理基本模式。 大量电话用户有关呼叫业务的申告。 除以上症状外,当机房出现温度过热,要通知TAC。由TAC决定是否部分或全部系统人工关电,以避免损坏硬件。 指定一位紧急情况协调员 emergency coordinator 为了避免在紧急情况下没有协调的情况,我们建议在每个网管中心OMC指定一位有经验的维护人员作为紧急情况协调员。当然,如果维护人员上轮班,应多设几位。 当发生紧急情况时,维护人员不应独自行动,而应该立即通知紧急情况协调员 紧急情况的处理 第一阶段 维护人员识别紧急情况的最初症状,并通知紧急情况协调员 第二阶段 紧急情况协调员根据系统状态和错误发生的结果判断是哪一种紧急情况,并通知TAC 第三阶段 TAC决定采用紧急情况手册中哪一个处理流程 第一阶段 维护人员的责任 有以下4种情况发生,可以怀疑出现紧急情况 1、SYPD上有严重告警 Critical alarm 两个红灯交替闪动(“CENTRAL UNITS” ,“RECOVERY”,“SYP”,…… 2、系统对输入没有反应/或者没有拔号音 当然应证实不是终端或电源的故障 3、很多用户申告:没有拔号音 4、很多用户申告:某个方向打不通 维护人员的操作 记录时间 通知紧急情况协调员 第二阶段 紧急情况协调员的责任 识别告警 接受维护人员的通知,明确四种情况中是哪一种情况发生 进入以下处理流程之一 ”SYP_AL“ ”SY_N_REA“ “SUB_COM” ” EMCY“、 ”TAC_MENU“ ” SSP_LIST“ ”T_CALLS“ 1、SYPD上有严重告警 Critical alarm 相对于其它三种情况,系统很有可能识别到一个中央错误并且正在自动恢复 Entry point: SYP_AL 2、系统对输入没有反应/或者没有拔号音 首先排除不是终端或电源的问题 不要惊慌 不要中断系统 有一些RECOVERY要持续大约30分钟(例如:ISTART2G),一般来讲这段时间内不能够建立呼叫 Entry point: SY_N_REA 3、很多用户申告:没有拔号音 首先检查外围部分是否中断(例如:公用的LTGB、DLU) 与第二点的区别是:从紧急情况开始到现在已过去几分钟,此时系统已进入准稳状态 ISTART2G正在运行 重复RECOVERY 系统中央硬件故障 电源中断 过热 Entry point: SUB_COM 4、很多用户申告:某个方向打不通 第四点与第三点的区别:用户有拔号音但不能拔打某个方向 可能原因: 本交换机内外围设备故障(DLU、LTG、SN、MB、CCNC) 其它交换机故障(对端市话局、长途局、汇接局等),出中继故障 软件或数据库错误 Entry point: SUB_COM EY100 循环Recovery (整个系统崩溃) 由于CP不能按升级概念完成任何一级的RECOVERY,而导致系统进入循环Recovery,可参考EY100来处理. 不成功Recovery可能是由以下不同的错误引起的: 1、由外围硬件错误引起,如双侧SN、MB或所有LTG; 2、由CP硬件错误引起,如MDD-0和MDD-1或IOC-0和IOC-1; 3、由软件错误引起,如LTG上的CODE或DATA错误,或CP上软件错误; EY100的处理流程 如是系统过热引起的系统崩溃则可参考EY350处理。 根据初始化消息判断:trace points是Bx74 or B254则是外

文档评论(0)

smdh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档