检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应急预案 概述 自定义预案 公共预案 父主题: 韧性中心
混沌演练 概述 故障模式 演练规划 演练任务 攻击场景说明 演练报告 父主题: 韧性中心
SLA管理 概述 自定义SLA 公共SLA SLA记录 父主题: 基础配置
事件管理 概述 创建事件 驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
告警管理 概述 处理告警 告警转事件 清除告警 查看历史告警 原始告警 父主题: 故障管理
流转规则 概述 创建流转规则 管理流转规则 父主题: 故障管理
集成管理 概述 集成管理 父主题: 故障管理
问题管理 概述 创建问题 驳回问题 重新提交问题 撤销问题 转发问题 受理问题 升降级 挂起问题 问题定位出方案 问题待现网实施 验证问题 问题处理记录 父主题: 故障管理
诊断工具 OS诊断 父主题: 故障管理
排班管理 概述 创建排班 添加排班人员 管理排班人员 排班场景管理 父主题: 基础配置
概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心COC的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户
概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在云运维中心COC中,WarRoom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
应用韧性评估 概述 配置任务 开始评估 评估报告 导出报告 父主题: 韧性中心
应用管理 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情 查看容量详情 父主题: 资源管理
自动化运维 补丁管理 脚本管理 作业管理 定时运维 账号管理 参数中心
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
执行记录 脚本工单 作业工单 补丁工单 资源操作工单 父主题: 任务管理
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
概述 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照事件和问题管理流程制定级别的类别的枚举值,便于满足当前业务。 父主题: 流程管理