- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
故障诊断与排查
谢茂楠
2019年8月25日
1
掌握学习的金钥匙-全身心的帮助他人,成就他人
2
互联网的便利
3
场景1
4
1、遇到故障我要怎么去思考,怎么去处理?
2、在处理故障的过程中我需要关注什么?
课程的目标
5
熟悉故障处理流程
掌握故障诊断的方法与步骤
课程的主要内容
6
概念及目的
故障排查流程
故障定位核心思想
定位角度分析
诊断工具
诊断的原则
OSI七层网络模型处理网络故障
1、概念与目的
7
概念
运维故障诊断是以业务系统相关的硬件、网络、服务器、系统、应用及业务使用等为知识基础。从故障现象出发,以诊断工具为手段获取诊断信息,确定故障点,查找问题的根源,排除故障,恢复
目的
有三方面的目的:确定业务系统的故障点,寻找业务系统运行的方法;发现业务系统规划和配置及使用过程中欠佳之处,改善和优化业务系统的性能;观察业务系统的运行状况,及时预测业务系统使用质量,并合理调配资源。
2、故障排查流程
8
2.2.1 识别故障现象
9
⑴ 故障现象发生时,正在运行什么进程?业务有什么反应
⑵ 这个进程以前运行过没有?
⑶ 以前这个进程的运行是不是可以成功?
⑷ 这个进程最后一次成功运行是什么时候?
⑸ 从最后一次成功运行起,哪些进程发生了改变?
2.2.2 对故障现象进行描述
10
对故障现象的详细描述显得尤为重要,如果仅凭用户对故障表面的描述,有时并不能得出结论。这时就需要我们亲自操作运行一下导致故障的程序,并
注意相关的出错信息;
可以参考以下几个建议:
⑴ 收集相关故障现象的信息内容,并对故障现象进行详细描述,在这个过程当中要注意细节,因为问题一般出在小的细节方面。
⑵ 把所有的问题都记录下来。
⑶ 不要匆忙下定论。
2.2.3列举可能导致故障的原因
11
应当列举可能的原因:
服务器硬件(网卡、内存、硬盘)
网络(交换机、路由器、网线)
操作系统(内核配置、防火墙)
应用程序(配置参数、版本变更)
等
2.2.4 缩小故障原因的范围
12
可根据出错的可能性把这些原因按优先级别进行排序,一个个先后排除。不要根据一次测试,就断定某一点是运行正常还是异常。另外,也不要在自己认为已经确定了的第一个错误上就停下来,应该把自己所列出的所有可能原因全部检查一遍为止。
2.2.5. 制订并实施排障计划
13
当确定了导致问题产生的最有可能的原因后,要制定一个详细的故障排除操作计划。在确定操作步骤时,应尽量做到详细,计划越详细,按照计划执行的可能性就越大。一旦制定好计划,就要按步骤实施这个计划。
2.2.6. 排障结果的评估
14
故障排除计划实施后,测试是否实现了预期目的。当排错行动没有产生预期的效果时,我们首先应该撤销在试图解决问题过程中对系统做过的修改,如果保留了这些修改,则可能会导致出现另外一些人为故障。
2.3故障定位核心思想
15
搜集现象的各个方面,分析现象找到核心,分段排查,缩小范围,定位故障点,最快解决故障,最终想方法防止同类或者相似故障的发生,提升系统稳定性与效率
2.4定位角度分析
16
故障的内容(单 个业务模块、部分业务模块、所有业务模块)
故障频率(偶尔、经常、一直)
故障范围(单台、部分、所有、内网、外网)
物理环境(网络设备供电情况、网络设备连接情况)
2.5 诊断工具
17
硬件工具
网络工具:测线仪
系统测试工具:笔记本、手机
硬件工具:硬件诊断卡
软件工具
网络工具:ping\tracert\netstat\arp\ipconfig\route print ,wireshark,tcpdump,lanSee
数据库工具:Idera.SQL.Check、 sql server studio、,toad for oracle
内存分析工具:windbg2 、httpwatc
日志分析工具:秋氏iis日志分析工具
http 分析工具:httpwatch、谷歌浏览器
2.6诊断的原则
18
2.6.1. 排除用户错误
在开始排除故障时,应该确认用户的操作是否完全正确,用户很
容易犯错误而误认为是局域网出了问题。
2.6.2 确定故障的范围
通常,业务系统的问题可以限定一天什么时候出现。一旦确定了故障的范围,试着重现故障的症状,如果可能,可以尝试严格按照发现故障人的操作步骤进行故障症状重现,要注意有些故障症状只有在特殊的环境下才能重现。
2.6.3 考查整个业务系统中涉及到的软硬件或者人为操作的变化
比如网络、服务器硬件、软件版本、软件升级发布、人为的操作、业务变更等变化
2.6.4 替换故障设置
19
值得说明的是:
⑴ 只有在找到能够正常工作的设备的条件下,才可以替换发生故障的同类设备。
⑵ 在对设备进行替换之前,要确保局域网现用配置文件的可恢复
您可能关注的文档
- 常见校园网组网方式与网络维护故障解决方案.ppt
- 抵制网络谣言、坚守思想底线.ppt
- 智能绿化灌溉系统解决专业方案.doc
- 第2课网络生活新空间.ppt
- 弱电智能化设计和施工资质申请条件.doc
- 弱电智能化推荐品牌(最终).doc
- 《网络安全法》简要解读.ppt
- 网络安全技术与实践.ppt
- 智能环卫信息管理系统技术方案.doc
- 二维码智能门禁介绍.doc
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)