检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 日期 修订记录 2023-11-30 第一次发布 2024-06-06 随服务版本刷新资料内容
故障管理 事件管理 WarRoom 集成管理 父主题: API
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理
补丁管理 查询补丁合规性报告 查询合规性报告详情 父主题: API
脚本工单 展示脚本工单基本信息 展示批次列表 展示实例状态统计信息 展示批次详情 展示工单列表 操作脚本工单 父主题: API
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
应用资源管理 以资源为基础,以应用为中心,将所有资源对象与应用统一管理,为不同业务场景提供多视角资源管理视图,为上层运维场景服务提供准确、及时、一致的资源配置数据。 资源管理 应用管理 多云配置 跨账号资源
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
批量FlexusL操作 FlexusL操作为用户提供了管理Flexus L实例的能力,支持进行批量开机、关机、重启、重装操作、切换操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
添加备注 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“添加备注”。 图2 添加备注 填写备注信息后,单击“提交”。 图3 填写备注信息 父主题: 处理事件
告警管理 汇聚告警 原始告警 父主题: 故障管理
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
修改起会规则 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在“起会规则”列表,选择需要修改的起会规则,单击“编辑” 修改起会规则。输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”修改起会规则。
流转规则 概述 流转规则 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 问题流程 创建问题 处理问题 问题历史记录 父主题: 故障管理