- 0
- 0
- 约5.39千字
- 约 15页
- 2026-03-06 发布于四川
- 举报
2026年医院信息系统重启恢复演练脚本
第1章演练定位与目标
1.1业务背景
2026年HIS(医院信息系统)已完成云原生重构,核心业务全部跑在容器+分布式存储之上。任何一次重启都不再是“关机—开机”这么简单,而是涉及容器编排、微服务依赖、数据一致性、网络策略、终端缓存、医保链上链下同步、物联网设备重注册等七层联动。一次失败的回切,将直接触发门急诊停摆、检验流水线堵塞、医保结算熔断、患者App闪退四大风险事件。
1.2演练目标
①验证RTO≤15分钟、RPO≤30秒的双活指标在真实重启场景下可重复落地;
②梳理出“容器→数据库→缓存→消息→终端→外联”六段回切的最长等待路径;
③沉淀一套“灰度重启”SOP,使夜间维护窗口可压缩至法定≤30分钟;
④建立“演练即生产”的纪律,任何脚本、参数、镜像、配置全部用生产级制品,杜绝“演练特供”;
⑤输出可量化的《重启质量报告》,作为2027年等保3.0复审的直接证据。
第2章组织与角色
角色
人数
定位
关键授权
演练当日打卡点
总指挥
1
分管副院长
可强制停门诊、调拨应急资金
T-00:00、T+15:00、T+30:00
技术指挥
1
信息科主任
拥有kubectl、ZStack、OceanStor最高权限
全程
应用组长
3
门急诊/住院/医技各1
可回滚版本、切换流量
T-05:00、T+08:00
数据组长
2
DBA+存储工程师
可冻结写IO、强制拉快照
T-02:00、T+05:00
网络组长
2
院内网络+运营商
可切BGP、封VLAN
T-03:00、T+10:00
终端组长
4
护理+医技+窗口+自助
可刷机、重注册物联网
T+00:00、T+12:00
业务验证
6
门急诊护士+收费+药师+检验师
拥有测试患者账号、可开真实处方
T+00:00、T+15:00
安全审计
1
等保测评机构驻场
可叫停违规操作
全程录屏
第3章演练范围与豁免清单
3.1范围
①生产双活集群:k8s-master-03/04/05,容器3200+;①生产双活集群:k8s-master-03/04/05,容器3200+;
②核心库:Oracle19cRAC+DG,数据量38TB;
③分布式缓存:Redis6.2Cluster128分片;
④消息总线:RabbitMQ3.11quorumqueue;
⑤对象存储:OceanStorPacific8节点;
⑥外联通道:医保电子凭证、省健康云、国家电子病历共享;
⑦终端:护士PDA812台、检验扫码枪245把、自助机186台。
3.2豁免
①科研专病数据库(含基因数据)——因伦理审批周期演练窗口;
②互联网医院直播问诊——已独立云原生,与院内HIS无共享库;
③备用UPS电池巡检——物理层维护,与重启逻辑无关。
第4章前置条件与基线
4.1时间基线
演练日凌晨02:00—02:30,门诊流量≤30人、住院医嘱录入≤5单、检查预约≤2单,满足“低峰”硬指标。
4.2数据基线
①门急诊业务表:就诊流水号Max=20260625015328;
②住院费用表:预交金余额Sum=¥4,785,620.00;
③LIS检验报告:当日已审核1874份;
④PACS影像:新增DICOM11.2GB。
4.3配置基线
所有ConfigMap、Secret、CRD、Helmvalues均已冻结版本v2026.06.25.0130,演练全程禁止热修。
4.4网络基线
①院内IPv4:10.0.0.0/8,已划分64个/20;
②医保VPN:MPLS线路带宽1Gbps,延迟≤8ms;
③互联网出口:双万兆,已封禁TCP445/135/139。
第5章重启策略设计
5.1灰度重启原则
“先边缘后核心、先只读后写、先本地后外联”。
5.2六段回切顺序
段号
技术域
重启动作
依赖前段
回退阈值
1
容器平台
滚动重启kubelet、containerd
无
任一NodeNotReady2分钟即回退
2
有状态服务
RedisClusterfailover
1
缓存丢键1%即回退
3
核心库
关闭DG只读,切主
2
TPS下降30%即回退
4
消息总线
重启RabbitMQquorum,重播死信
3
消息堆积10万即回退
5
外联通道
重新协商医保SSL双向证书
4
医保返回4601即回退
6
终端注册
批量重发物联网MQTT注册包
5
离线终端20台即回退
5.3回退机制
每段设置“双阈值”:技术指标+业务指标任一超标立即触发“一键回退”Ansibleplaybook,30秒内回滚至上一段状态,并自动在ITSM开RCA单。
第6章详细时间脚本(T为
原创力文档

文档评论(0)