检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“弹性云服务器ECS > 重启”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
根据命名规则,自定义演练任务的名称。 test-drill 期望恢复时长(分钟) 从故障发生到故障恢复的预期时间,单位为分钟。 在故障注入之后,应用自恢复或在执行应急预案时恢复到正常状态的期望时间,该时间不会对演练任务产生影响。 3 单击“添加一个新的攻击任务”。 默认有1个攻击任务组,单击“添
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重装操作系统 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“弹性云服务器ECS > 重装操作系统”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
不选择区域展示“默认”,表示不涉及区域。 故障发生时间 请填写故障发生时间。 默认为创建WarRoom时间,故障发生时间不得晚于创建WarRoom时间。 故障恢复时间 可选参数。在故障已恢复阶段为必填参数。 故障恢复时间不得早于创建WarRoom时间。 故障影响 可选参数。在故障已恢复阶段为必填参数。
故障分析成员、应用SRE等各方面专家资源组织恢复,提升协同交流、诊断定界和处理效率。 快速感知事件的发生并及时响应,缩短MTTR(故障恢复时间)。 Global 改进管理 改进管理指在处理事件、WarRoom或进行演练过程发现产品、运维或管理方面需要改进完善的地方,通过改进单的方式跟踪闭环。
展示脚本工单基本信息 功能介绍 查询执行:基本信息 执行类型、执行名称、创建人、创建时间、结束时间、执行状态、标签(脚本id,脚本名,执行脚本参数,执行用户,超时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid}
Cron表达式使用 操作场景 Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 -
清除告警参数说明 参数 说明 业务是否中断 可选项“是”、“否”。 故障发生时间 仅业务是否中断选择“是”时需要设置。 请填写故障发生的时间。 故障恢复时间 仅业务是否中断选择“是”时需要设置。 请填写故障的恢复时间。 备注 可选参数。请填写备注。 备注支持中文字符、英文字母、数字及特殊字符,长度不超过100个字符。
故障发生的情况,支持故障紧急终止。 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 自定义脚本规范请参考如下代码。
行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。 表1 应用韧性评估支持的云服务和支持区域 云服务 资源类型 支持区域 弹性云服务器 ECS 云服务器(ecs.cloudservers) 华北-北京四(cn-north-4) 华南-广州(cn-south-1) 华东-上海一(cn-east-3)
在执行应急预案时恢复到正常状态的实际时间。 表1 修改实际恢复时长参数说明 参数 说明 故障发现时长(分钟) 请填写故障发现时长。 从故障注入完成到收到故障告警的时间。 故障定界时长(分钟) 请填写故障定界时长。 从收到告警到完成故障定界的时间。 故障恢复时长(分钟) 请填写故障恢复时长。
单击“变更结束”。 设置“填写变更结果”。 表1 填写变更结果参数说明 参数 说明 变更结果 可选项“成功”、“失败”。 变更验证 可选项“变更时间窗内可验证”、“变更时间窗内不可验证”。 验证报告或验证说明 单击“添加文件”上传验证报告或验证说明相关文件。 支持最多上传10个文件,支持文件类型:
说明 影响应用 在下拉列表选择受影响应用。 开始时间 请填写应用开始受影响的时间。 默认为创建WarRoom时间,开始时间不得晚于创建WarRoom时间。 恢复时间 可选参数。请填写应用恢复时间。 恢复时间不得早于创建WarRoom时间。 影响描述 请填写应用相关的影响描述。 限制长度最长500个字符。
上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 混沌演练目前已支持弹性云服务器(ECS)、裸金属服务器(BMS)和Flexus应用服务器L实例(FlexusL)探针类武器的攻击对象,并提供了相应的资源类武器和
变更单状态校验: 提权应用,Region必须与变更单中的一致; 此次提权的操作人必须是变更单的实施人; 当前操作时间必须在变更单的计划实施时间窗内(当前操作时间必须大于计划开始时间且小于计划结束时间); 变更单必须单击“变更开始”。 开启工单提权后,北向接口无法使用。例如执行脚本开启工单提权,北向调用脚本接口无法使用。
单次执行:在指定的时间执行一次定时任务。 周期执行:按照设置的规则循环执行,直到规则结束时间。 执行时间 与定时类型搭配使用。 当定时类型为单次执行时,请填写执行的时间点。 当定时类型为周期执行时,支持两种方式。 简单周期:以星期为单位选择具体执行时间。 Cron表达式:以时间表达式设置
WarRoom状态 操作场景 WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理
短信、企业微信、钉钉、邮件、飞书:选择通知渠道后,按照审核人员预留的信息进行通知。设置审核人员信息详细操作请参考修改人员信息。 不通知:不进行通知。 截止时间 请配置待办的截止时间。 标签 可选参数。选择已有标签或输入标签按“回车键”创建。 推荐方案 请填写推荐方案。 支持中文、英文、数字及特殊字符,长度不超过1000字符。
改进管理 操作场景 事件、Warrroom、混沌演练、PRR评审创建改进单进行受理,并在期望时间内完成改进任务,处理改进单过程若发现责任人不是本人支持转发责任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}