检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准化故障管理 COC通过设置流转规则,将原始告警清洗为事件单或告警单,帮助用户进行统一的告警管理。当原始告警命中流转规则时,创建事件/告警,并根据排班管理通知对应责任人。责任人可对告警进行处理或转事件,定位恢复后,清除告警。对于无法清除的告警,可以转事件进行升级或启动WarRoom
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“挂起”,页面会显示问题挂起弹窗页面,并填写挂起信息。 图1 问题单挂起 提交挂起后创建人点击问题单名称进入问题详情页面,单击页面右上角的“挂起审核”,填写审核信息并提交。提交后问
选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图3 熔断策略 设置是否允许重启。 部分补丁需要重启生效,若选择否,则需要您择期安排重启 确认执行信息,若无误则单击“确定”。 图4
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开启展示操作页 查看执行结果。 图3 执行结果 执行结
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 查看执行结果。 图3 执行结果 执行结
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 停止展示操作页 查看执行结果。 图3 执行结果 执行结
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开机展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 选择是否强制重启。 强制重启会导致云服务器中未保存的数据丢失,请谨慎操作。 单击“提交”。
不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 选择需要切换的镜像。 图2 可切换的镜像页面 在“确认执行”弹框中,单击“确定”。
在左侧导航栏选择“基础配置 > 排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班角色后单击“提交”。若已有排班场景和排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。
选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图8 熔断策略 单击“提交”。 图9 单击提交后执行界面 确认执行信息,若无误则单击“确定”。 扫描工单执行完成后单击“合规性报
在集成管理页面有待集成中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”会跳转至集成接入步骤页面,可填写集成监控系统的简称和全称,并根据提示接入您的监控系统,名称支持重新命名。 图2 自定义集成操作步骤 自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。 启用、禁用集成操作步骤
与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云