2021中国混沌工程调查报告.docx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国混沌工程调查报告 (2021 年) 混沌工程实验室 2021 年 11 月 混沌工程实验室中国混沌工程调查报告 2021 混沌工程实验室 中国混沌工程调查报告 2021 前言 随着分布式架构的普及以及云计算技术的成熟,国内企业应用云原生化推进业务系统的迭代速度越来越快,后端系统架构日趋复杂,服务间的依赖越来越多,调用的链路越来越长。宕机引发巨额损失、严重影响用户体验的新闻层出不穷,为了让云基础设施更好地适应复杂多变的运行环境,持续提供超大规模、超高稳定性的运行效能,一种新的软件思潮——“混沌工程学(Chaos Engineering)”应运而生。混沌工程提供了一种端到端的稳定性测试理念与工具框架,通过主动引入故障来充分验证系统和应用的脆弱性,提前发现并解决问题,力求防患于未然,从而从根本上提高系统和应用的鲁棒性。 2020 年初,中国信通院开始组织专家进行混沌工程技术研究,提出应用混沌工程方法来验证企业软件系统的韧性架构。 2021 年 4 月 2 日,混沌工程项目研讨会议在京召开并发布《混沌工程平台能力要求》标准纲要,并在 2021 年 7 月于可信云大会上牵头成立国内首个混沌工程实验室,旨在探索混沌工程在国内各领域典型应用场景中的实践落地,联动云计算上下游企业来共同推进混沌工程概念快速普及。 为了了解我国混沌工程发展全貌,混沌工程实验室于 2021 年 9 月启动《中国混沌工程调查报告》问卷征集活动,此举有助于更深入探索我国云上软件系统稳定性现状、混沌工程使用情况、行业采纳度、技术成熟度及未来发展趋势,以期推动混沌工程在我国的概念普及,提升云上软件系统稳定性,促进软件质量发展。 本报告采用在线调查加线下访谈的方式,共回收有效问卷 1016 份、访谈企业 17 家。报告的第一部分介绍调查背景,第二部分介绍我国混沌工程当前使用情况,第三部分是混沌工程致力于提高的系统稳定性现状,第四部分聚焦混沌工程的发展建议。本报告以调查结果为基础,力争详实客观地反映混沌工程领域应用现状与痛点需求,为广大从业人员、专家学者和研究机构提供真实可信的数据参考。 本次报告的问卷发放、数据采集及文稿审核工作得到混沌工程实验室所有成员单位(见文末附录)及 InfoQ、中国云原生社区等单位或组织的大力支持,在此谨表示最衷心的感谢!同时也对接受混沌工程调查访问的用户朋友表示最诚挚的谢意! 目录 TOC \o 1-3 \h \z \u 前言 3 目录 4 观点摘要 5 一、调查背景 6 (一)调查方法及样本 6 1、调查方法 6 2、样本描述 6 (二)报告术语界定 8 二、混沌工程应用现状 9 三、软件系统稳定性现状 16 四、发展建议 22 编后语 23 附录 24 观点摘要 国内软件系统稳定性有较大可提升空间。调查数据显示,近 20%的受访用户所负责的产品可用性低于 2 个 9 (意味着用户每个月要忍受超过 7.3 小时的服务故障),超过 4 成产品的可用性低于 3 个 9(意味着用户每个月要忍受超 过 44 分钟的服务故障)。故障发生之后的解决情况也差强人意:仅不到一半的故障平均发现时长(MTTD)小于 1 小时; 故障平均修复时长普遍超过 1 小时,超过 6 成故障修复时间(MTTR)高于 1 小时,甚至有约 20%的服务故障修复时间超过 12 小时。日益复杂的 IT 系统与快速迭代的软件交付为系统稳定性的保障带来诸多挑战和不确定性,国内软件系统稳定性仍有较大提升空间。 混沌工程是提升产品可用性的有效手段,是建立稳定性优先战略的技术核心。调查数据显示,随 着混沌工程使用频率提升,低可用性(可用性低于 99%)的产品占比急剧萎缩,高可用性(可用性高于 99.99%)的产品占比迅速增长。混沌工程通过在生产环境中执行探索性测试以发现系统中的隐藏问题,在软件系统稳定性维护上展现出巨 大价值。其中,提升服务可用性及降低故障修复时间是两大主要收益。65%的受访者认为采用混沌工程提升了服务可用性, 49.85%的受访者认为混沌工程帮助降低了 MTTR(数据详见图 14)。企业需要建立稳定性优先(Stability First)的战略,构建系统稳定性保障体系,稳步推进数字化转型进程。 混沌工程应用当前成熟度偏低,市场需要成熟、完善的混沌工程商业产品及咨询服务。超过 3 成企业仅在小范围使用混沌工程,仅 8.68%的企业较大规模地应用混沌工程,混沌工程在企业内部渗透率有待进一步提高 (数据详见图 6);同时,近半数企业在研发、测试环境中使用混沌工程,仅不到 20%的企业在生产环境中开展混沌工程演练,混沌工程在内部使用的技术复杂度不够高。而阻碍用户大规模、深度使用混沌工程的主要障碍是:缺乏相关经验, 担心故障

文档评论(0)

策划大全 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档