检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中Wa
移动应用管理 操作场景 移动应用管理用于管理事件启动Warroom时,创建企业微信Warroom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用管理 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
进展通告 操作场景 进展通告在故障发生或处理过程将故障处理进展及时同步给相关人员,关注该故障的人可快速掌握故障进展。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
变更管控 变更管控是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。
清除告警 操作场景 通过云运维中心清除指定汇聚告警。 清除后的汇聚告警会在历史告警页签中找到。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“清除”或“批量清除”。
原始告警 操作场景 通过云运维中心查看原始告警的告警源名称、告警状态、告警级别、告警来源、关联应用等。 原始告警的应用属性为命中的流转规则配置的应用。一条原始告警可以触发多个流转规则,因此其对应应用不唯一。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“
与会成员 操作场景 与会成员主要是为了快速恢复故障,将参与故障恢复的人员拉入群组,或通过电话或短信及时通知故障恢复人员响应并处理故障。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom
查看告警 操作场景 通过云运维中心查看汇聚告警发生时间、收敛数量、所属应用、告警等级等汇聚告警相关信息。 并可以通过搜索框查看符合搜素条件的汇聚告警相关信息。 操作步骤 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索
事件流程 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。
审批配置 审批配置概述 支持用户根据自身业务诉求,从变更类型、变更级别两个维度配置审批流程&审批人。 创建审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,单击“创建审批配置”,进入“创建审批配置”页面。 图1 创建审批配置 填写审批配置内容,单击“提交”。
alarm_id id alarmName 告警名称 alarm_name metadata中的event_name alarmLevel 告警级别,取值有:紧急、重要、次要、提示 AlarmLevel event_severity time 告警发生时间 time starts_at nameSpace
处理告警 操作场景 通过云运维中心对汇聚告警进行相关处理。 可以选择作业和脚本两种方式对汇聚告警进行处理动作。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”,进入“告警管理”页面。 单击“汇聚告警 > 当前告警”,进入“当前告警”页面。 选择需要处理的告警,单击操作列“更多
演练规划 操作场景 创建演练规划时您可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理
创建问题 操作场景 通过云运维中心r创建一个问题单。 前提条件 需要先在应用管理中创建您的应用。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。
演练报告 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”列表。在演练记录列表“操作”列,单击
统计WarRoom的数量趋势 选择时间周期内,所有WarRoom的数量 天/月 个 监控发现率 告警中心 发生的事件单中,有相关告警的事件单占比 符合过滤条件有相关告警的事件数/符合过滤条件总的事件数 天/月 百分比 变更 变更管理 统计变更单的数量趋势 选择时间周期内,所有变更单的数量
创建事件 操作场景 通过云运维中心创建一个事件单。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,单击“创建事件单”,进入“创建事件单”页面。 图1 事件单列表 填写事件单基本信息后,单击“提交”。
历史告警 操作场景 通过云运维中心查看清除过的告警信息。 在历史告警页签中,您仍然能查看汇聚告警的相关信息和处理记录等。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 图1 历史告警列表 在集成告警列表“操作”列选择
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”。 单击左上方“演练任务”。 单击“创建演练任务”。 同时也可以通过演练规划接单功能进入创建演练任务页面,详细步骤请参考演练规划。 设置“基础信息”。 表1