检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云运维中心支持将清除告警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。
操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 在“原始告警”页签,单击告警名称。 查看原始告警详情。 父主题: 告警管理
添加与会成员 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“邀请”。 设置“邀请”。 表1 邀请参数说明 参数 说明 与会方式 可选参数,可选项“企业微信”、“钉钉”、“飞书”。
驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 问题单状态为“被驳回”。 父主题: 问题管理
概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。
流程管理 概述 事件流程 问题流程 变更场景 父主题: 基础配置
资源管理 概述 同步资源 接入其他云厂商 管理IDC离线资源 管理跨账号资源 配置UniAgent 查看资源详情 查看资源拓扑 标签管理 收藏企业项目 父主题: 资源管理
概述 应用韧性评估用于衡量应用在面对各种干扰和压力(如硬件故障、网络波动、流量峰值、安全攻击等)时,能够维持正常功能和性能的评估方式。韧性的概念不仅仅局限于恢复能力,还包括预防问题、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估项
公共预案 操作场景 您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图
服务目录 概述 管理产品组合 管理产品 启动产品 管理实例 父主题: 资源管理
修改脚本 功能介绍 修改作业脚本:自定义脚本 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。 脚本内容最大4096个字符。 脚本参数个数最多20个。 脚本描述:最大256个字符。 单个参数的参数名称 64个字符,只支持字母+数字
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
解决方案 混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程
概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理
排班管理 概述 创建排班 添加排班人员 管理排班人员 排班场景管理 父主题: 基础配置
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作
WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。 单击需要查看的WarRoom标题。 页面展示WarRoom详情。页面右上方查看WarRoom状态。 1.故障已恢复之前受影响应用必须先走到已恢复状态。
SLA管理 SLA管理概述 自定义SLA 公共SLA SLA记录 父主题: 基础配置