检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom是在发生重大紧急或群体故障,可召集故障分析成员、应用SRE等各方面专家资源组织恢复,提升协同交流、诊断定界和处理效率。 快速感知事件的发生并及时响应,缩短MTTR(故障恢复时间)。 Global 改进管理 改进管理指在处理事件、WarRoom或进行演练过程发现产品、运维或管理方面
与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云
事件创建:创建事件后需要发送通知。 事件驳回:事件被驳回后发送通知。 事件转发:事件转发后发送通知。 事件验证:事件解决后进入待验证状态时发送通知。 事件完成:事件已经处理并验证通过后发送通知。 事件验证未通过:事件进入待验证状态下,验证不通过时发送通知。 事件驳回后完成:事件被驳回后,事件被关闭后发送通知。 父主题:
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 单击“提交”并“确定”。 执行自定义作业支持变更管控功能。开关和使用请参考变更管控章节。 对于工单执行是否完成,支持以下操作: 若工单执行中: 暂停:单击
操作分别搜索选择“smn:topic:create”、“smn:topic:subscribe”两个action,用于授予组织管理员租户跨账号自动创建主题通知,并订阅与管理员主题相同的通知方式的权限; 继续点击“添加权限”,云服务选中“云监控服务”(CES); 操作搜索选择“ces:alarms:cr
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤9,执行步骤10。 设置“任务类型”。 作业:在下拉列表选择选择作业,支持自定义作业和公共作业。
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤8,执行步骤9。 设置“执行作业”。 区域:请选择目标实例所在区域。
告警:生成告警管理,支持基于响应预案手动或自动化快速闭环。 数据源 请选择数据源。 数据源是原始告警产生的来源。 配置规则前请确保数据已接入并启用,当满足所有条件时,运行流转规则。数据源设置请参考集成管理。 触发条件 选择触发条件的key、比较方式、value。 支持添加触发条件,