故障排除的最佳实践.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
故障排除的最佳实践

第 1 章 故障排除的最佳实践 故障排除是一项技能,和所有的技能一样,不论是变魔术、弹 吉他、烹饪或者编程,有的人生来就有天分,有的人则不然。如果 你很自然地就掌握了某种技能,可能会认为别人也能轻松掌握。毕 竟,如果你第一次尝试就学会了骑自行车,可能就会想当然地以为 别人学会骑自行车也不需要付出多少努力。 有人天生善于排除故障,当出现故障的时候,他们会不假思索 地采取行动,本能地选择方法进一步隔离故障,直到查清故障的根 本原因。当你把汽车交给一个善于排除故障的汽车修理工,在你刚 描述完车子的“症状”后,他就已经开始摆弄你的汽车了,因为在 你描述时他已经把问题锁定在少数几个成因上,并且预判了问题的 原因。做过一些测试之后,他确认了预判的正确性,开始动手修理 了。另外一种情况是,当你把汽车送给一个不善于排除故障的汽车 修理工,你将会收到高昂的维修账单,不断地去维修店换掉汽车的 一个又一个部件。 故障排除技能任何人都可以学会,和很多技能一样,故障排除 需要用到一些技术,不论是否有天赋,都可以通过训练使这些技术 成为本能。你不仅想成为排除故障的高手,还希望能够成为排除故 2 ◆ 第1 章 故障排除的最佳实践 障的快手。在用金钱衡量故障时间的环境下工作更是这样。毕竟, 不论是优秀的汽车修理工还是差的汽车修理工最终都会修好你的 车,但是你更希望哪个汽车修理工来修理你的汽车呢? 在DevOps 组织里,团队中的每位成员都负责一部分故障排 除。开发者排除软件中的漏洞,系统管理员排除硬件问题,质量团 队首先花费大量时间寻找问题,然后尝试定位问题的根本成因。当 DevOps 团队中的每个人使用相同的经过验证的故障排除技术时, 整个团队都会从中受益。 本章介绍的一些故障排除最佳实践可以应用到任何问题上。当 你读过本章之后,会发现其中大部分实践都是常识,但是你会惊讶 地发现,当遇到问题时,竟然有那么多人都忽略了这些常识。 1.1 划分问题空间 如果让你去猜我正在想的一个 1 ~100 内的数,你会猜哪个? 比如这个数是73 ,每次猜完之后我会告诉你你猜测的数字比这个 数大还是小。一些人可能会随机猜某个数字,或者从 1 开始逐步 递加。善于排除故障的人可能会这样猜:50 (小了),75 (大了), 63 (小了),69 (小了),72 (小了),73 。每次猜测都会排除一半 的可能性。这个例子里,为找到正确答案只猜了6 次。而如果从 1 开始递加,需要猜73 次。如果是随机猜,有可能要遍历所有的数 字才能猜中答案。 这个方法适用于所有的故障排除。面对问题,一些人从可能产 生问题的原因列表的底层开始,一步一步解决问题,另外一些人选 择随机测试直到幸运地找到原因。一位优秀的故障排除人员选择的 每一项测试的结果都会排除一类原因,而不是一个原因,将故障分 而治之。划分问题空间之后,即使一项测试不能找到故障的根本原 因,测试结果最少也能排除掉几个可能的原因。 1.2 协同工作时的良好沟通 ◆   3 例如,如果我尝试用浏览器访问一个网站,但是请求超时,此 时我想测试是网站的原因还是我的网络连接有问题,但我不会立即 去查看网线是否没有插好,而是访问一两个通常都很稳定的其他网 站。如果别的网站能正常加载,就可以确定我的网络连接正常,从 而省去一系列本地网络测试。 当你和团队中的其他人协作排除故障时,也会在团队成员之间 划分问题空间,没有比跟踪一个问题的时候发现有人也在做相同的 测试更坏的事情了。当你在团队环境下着手解决一个问题时,要给 每个人分配不同的测试并保证一旦某个人排除了一个原因,能及时 把结果传达给其他人。 1.2 协同工作时的良好沟通 建立良好的沟通方法是团队排除故障的最大挑战之一。如果没 有良好的沟通,两个人不会意识到正在解决相同的问题,

文档评论(0)

aa15090828118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档