检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RES12-03 定期应急恢复演练 定期测试突发事件应急恢复处理,以便在出现问题后能进行高效的恢复处理。 风险等级 高 关键策略 每年至少进行一次应急恢复演练;通过演练可提升操作人员的熟练程度。 演练期间严格按照应急预案进行恢复,以检验应急预案的准确性。 演练结束后需要对恢复过程进行回溯,并优化应急预案。
在第一次同步数据完成前请不要进行容灾演练操作,否则可能导致容灾演练服务器无法正常启动。 创建容灾演练时,如果保护组内的容灾站点云服务器加入了企业项目,容灾演练创建的演练云服务器不会自动加入到企业项目,如有需要请手动将演练云服务器加入到企业项目。 创建容灾演练时,若传入drill_vpc_
在弹框中单击“确认”,即可删除演练任务。 图21 删除演练任务 启动演练 对已经创建的演练任务,启动演练。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 在演练任务列表的“操作”列,单击“启动演练”,进入“演练记录详情”页面。 图22 启动演练 在“演
rams object 容灾演练的信息。 表4 ShowDisasterRecoveryDrillParams 参数 参数类型 描述 id String 容灾演练的ID。 name String 容灾演练的名称。 status String 容灾演练的状态。 drill_vpc_id
演练报告 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”列表。在演练记录列表“操作”列,单击
混沌演练”页面,选择“风险管理 > 演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障
生产站点与容灾站点的数据能否在创建容灾演练那一刻实现实时同步。 执行切换操作后,容灾站点的业务是否可以正常运行。 图1 容灾演练 使用须知 创建容灾演练时,如果保护组内的容灾站点服务器加入了企业项目,容灾演练创建的演练服务器不会自动加入到企业项目,如有需要请手动将演练服务器加入到企业项目。 创建容灾演练时,如果
RES12-05 应急恢复回溯 在业务进行应急恢复处理后,需要对事件进行回溯并进行优化,以避免故障的再次发生。 风险等级 高 关键策略 对问题进行定位和修复,优化产品能力,减少同类事件的发生。 针对应急恢复过程进行总结,优化恢复过程。 父主题: RES12 应急恢复处理
故障切换演练 查看监控器活跃的数据中心。 登录MAS控制台,在“多活管理”页面单击多活实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,查看创建的“litemall-db”MySQL监控器。 在未出现故障前,监控器的活跃数据中心为数据中心1,即主数据中心,此时商城应用是连接数据中心1。
删除容灾演练 功能介绍 删除指定的容灾演练。删除后: 容灾演练服务器、容灾演练服务器上挂载的磁盘和网卡将被一并删除。 演练VPC、演练VPC的子网不会被删除。您可以继续使用该VPC创建其他云服务器。 接口约束 容灾演练状态为available或者error或者error-deleting。
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。
导致演练失败,切换或/容灾演练完成后会自动删除该ECS。 为保证在灾难发生时,容灾切换能够正常进行,建议您定期做容灾演练。 使用须知 创建容灾演练时,如果保护组内的生产站点服务器加入了企业项目,容灾演练创建的演练服务器不会自动加入到企业项目,如有需要请手动将演练服务器加入到企业项目。
删除容灾演练 操作场景 当您不再需要容灾演练时,请删除容灾演练以释放资源。删除容灾演练会自动删除此容灾演练的容灾演练服务器 前提条件 待删除的容灾演练有其它操作正在执行时,不可以执行删除操作。 操作步骤 登录管理控制台。 单击服务列表,选择“存储 > 存储容灾服务 SDRS”。 进入“存储容灾服务”页面。
在基本信息区域右上角,单击“容灾演练”,进入容灾演练页面。 图1 保护组容灾演练入口 根据界面提示配置容灾演练弹性云服务器的信息。 图2 批量配置容灾演练服务器规格 表1 参数说明 参数 说明 取值样例 保护实例 勾选所有待进行容灾演练的保护实例。 - 弹性云服务器(容灾演练) 选择容灾演练弹性云服务器的规格。
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练 配置基本信息,输入演练名称和描述。
rams object 容灾演练的信息。 表6 ShowDisasterRecoveryDrillParams 参数 参数类型 描述 id String 容灾演练的ID。 name String 容灾演练的名称。 status String 容灾演练的状态。 drill_vpc_id
s objects 容灾演练列表。 count Integer 列表中包含的容灾演练个数。 表5 ShowDisasterRecoveryDrillParams 参数 参数类型 描述 id String 容灾演练的ID。 name String 容灾演练的名称。 status String
管理容灾演练 删除容灾演练 父主题: 同步复制管理(只适用于存量经营)
障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题