检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题
应用资源管理 以资源为基础,以应用为中心,将所有资源对象与应用统一管理,为不同业务场景提供多视角资源管理视图,为上层运维场景服务提供准确、及时、一致的资源配置数据。 资源管理 应用管理 多云配置 跨账号资源
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
批量FlexusL操作 FlexusL操作为用户提供了管理Flexus L实例的能力,支持进行批量开机、关机、重启、重装操作、切换操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
告警管理 汇聚告警 原始告警 父主题: 故障管理
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
流转规则 概述 流转规则 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
诊断工具 OS诊断 父主题: 故障管理
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
排班管理 排班管理概述 排班场景管理 父主题: 基础配置
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。 父主题:
SLO中断记录 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“中断记录”,进入“中断记录”页面。 图1 中断记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索