检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤
创建脚本 功能介绍 创建作业脚本:自定义脚本 脚本有标签属性,表示是高危脚本。创建时候不需要对脚本进行是否是高危的二次校验。 进行租户隔离;北向接口创建的脚本,审批人字段不填写,默认不需要审批 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。
执行自定义作业 操作场景 自定义作业配置完成后,若需要执行自定义作业,请按如下操作进行。 注意事项 在执行作业前需要确认是否拥有目标实例的资源权限。 执行自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义
选择需要清除的告警,单击操作列“清除”。 设置“清除告警”。 表1 清除告警参数说明 参数 说明 业务是否中断 可选项“是”、“否”。 故障发生时间 仅业务是否中断选择“是”时需要设置。 请填写故障发生的时间。 故障恢复时间 仅业务是否中断选择“是”时需要设置。 请填写故障的恢复时间。 备注 可选参数。请填写备注。
功能介绍 创建事件单 URI POST /v1/external/incident/create 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 region 否 Array of strings 区域Code,如果自动拉起WarRoom则为必填,现在只支持1个
请在下拉列表依次选择:目标资源、监控指标、下限值、上限值。 监控故障演练过程中各业务指标的数据,位于上下限区间表示业务正常,供用户评估是否需要停止演练。 自动回滚 请选择是否开启自动回滚。 故障注入自动回滚,并恢复到注入前状态,部分不支持终止故障的武器不能配置自动回滚 单击“完成”,完成攻击任务添加。
/v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 execute_param 是 ScriptExecuteParam
面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及的故障应用。 业务是否中断 可选项“是”、“否”。 责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。
生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及故障的应用。 业务是否中断 可选项“是”、“否”。 责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。
变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否允许重启:部分补丁需要重启生效,若选择否,则需要您择期安排重启。 单击“提交”并“确定”,开始执行工单。 对于工单执行是否完成,支持以下操作: 若工单执行中: 暂停:单击右上方“暂停”,当前批次执行完成后下一批次暂停执行。
/{instance_compliant_id} 表1 路径参数 参数 是否必选 参数类型 描述 instance_compliant_id 是 String 合规性报告id 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 偏移量 最小值:1
不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中
获取脚本详情 约束条件: 只能查询自定义脚本详情 URI GET /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 无 响应参数 状态码: 200 表2 响应Body参数
/v1/job/script/orders/{execute_uuid}/batches/{batch_index} 表1 路径参数 参数 是否必选 参数类型 描述 batch_index 是 Integer 批次index 最小值:1 最大值:20 execute_uuid 是 String
、docx、txt、pdf,上传文件不能超过10MB。 设置“同类故障”。 表6 同类故障参数说明 参数 说明 是否有同类故障 可选项“是”、“否”。 事件单号 是否有同类故障选择是时必填。 支持添加和删除事件。 设置“改进措施”。 表7 改进措施参数说明 参数 说明 产品改进 请填写产品改进详情。
目标实例目前仅支持弹性云服务器(ECS),裸金属服务器(BMS)和云耀FlexusL实例三种类型。 定时运维任务“状态”列为“正常”(免审批或已审批入库的)、“是否启用”列为“开启”才会自动执行脚本/作业。 父主题: 定时运维
功能介绍 查询warroom信息 URI POST /v1/external/warrooms/list 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 limit 否 Long limit 最小值:0 最大值:1000 缺省值:0 offset 否 Long 查询数量
在下拉列表选择故障应用。 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。 严重程度默认“P1”最严重,“P5”最轻微。 业务是否中断 可选项“是”、“否”。 事件类别 在下拉列表选择事件的类别。 事件名称 根据命名规则,自定义事件的名称。 事件描述 对事件进行描述。
FlexusL 区域 在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。