网站大量收购独家精品文档,联系QQ:2885784924

软件工程课程支持事故结.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

总结

⼀个真实的事故

▸部⻔:计蒜客核⼼⼯程开发部

▸发现⽇期:2016年9⽉24⽇、9⽉25⽇

▸项⽬:⼯程课程判题、命令⾏引导课程

▸事故描述:

▸1.「超时实例销毁接⼝」在9⽉22⽇的升级中更换了接⼝名称,调⽤接⼝的相关程序未及时更新

被调⽤接⼝对应的接⼝名称。这⼀过程中存在接⼝更换未⼴播⾄接⼝消费者的情况,造成消费者

在得到报警并进⾏排查过程中未能及时排除问题。

▸2.未正确接⼊服务报警系统Sentry,服务出现异常后未被及时发现,响应速度过慢。

总结

结构及关键问题

!

回收落到外⼀层的「意

外清扫保障监护程序」,

导致服务器最终超载。

总结

事故处理过程

▸9⽉24⽇傍晚,接到⽤户侧反馈功能可⽤性差(VIM打开后部分条件下⽆法

看全,只能按要求输⼊)的问题,前端⼯程组对VIM进⾏升级

▸9⽉25⽇出现服务连接中断问题,系统⼯程师投⼊⼯作,对实例进⾏⼿动清

扫,恢复线上可⽤;误判为业务压,采取了将服务器性能进⾏拓展的处

理策略。

▸9⽉25⽇晚间,项⽬经理介⼊,发现课程在线使⽤与实例峰值不匹配,

帮助系统⼯程师定位实例销毁不正常的问题,并发现接⼝被修改问题。

22:40分完成修复并对所有相关服务代码进⾏上线部署,恢复服务。

总结

系统性事故

▸线上疏漏:对于合作产品的重视度不够,未接⼊报警系

▸接⼝变更未通知:沟通环节存在严重问题,接⼝⽣产者对于接⼝消费者未

及时通知,违背了⼯作流程,埋藏问题。

▸⽂档更新滞后:接⼝⽣产者在接⼝变更后未对⽂档进⾏更改,造成接⼝消

费者⽆法及时排除出问题。

▸测试存在死⻆:接⼝消费者未正确添加接⼝相关的测试⽤例,导致接⼝⽣

产者部署代码时,⾃动化部署程序未拒署。

总结

事故总结

▸靠软件⼯程吃饭的⼈,学了软件⼯程,却在实践上对⾃⼰没能严格要求。

▸软件统⼯程,各环节之间都要做到「相信但不依赖」

▸接⼝消费者不能认为接⼝就不会「挂」,不写测试⽤例

▸接⼝⽣产者不能认为接⼝消费者⼀定会写了对应的⽤例,就不进⾏沟通

▸接⼝⽣产者不能随意的认为「后补⽂档」是⼀个安全的做法

▸运维⼯程师对于⼀个上线后的系统不接⼊报警不能

希望我们这次的事故,能对⼤家有所帮助

也诚恳的向各位同学道歉!

软件⼯程不是说⼀说,更不能当成就上⼀⻔课的事情

软件⼯程是⼤家这么多年的教训和经验的积累,⼀定要重视并且投⼊实践

Email:yuhaoran@

WeChat:haoran_yu

文档评论(0)

wx5620 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档