突袭演练实战经验

摘要

随着酷家乐业务快速成长,用户对于服务的稳定性要求也越来越高,再加上业务复杂度与日俱增,发生线上故障时,由于缺失合理预案、研发人员缺少应急经验,各种报警满天飞,导致自乱阵脚,延长故障持续时间,导致故障无法快速止血。

系统是否健壮?是否有完善且合理的应急预案?研发人员是否掌握基础应急止血能力?能否根据问题现状快速定位出故障根因?等等一系列问题需要有合理的手段和方法,早于线上故障发生前,进行锻炼和验证。

欢迎在评论区写下你对这篇文章的看法。

首页 - Wiki
Copyright © 2011-2022 iteam. Current version is 2.94.1. UTC+08:00, 2022-07-07 01:03
浙ICP备14020137号-1 $访客地图$