检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息
事件流程 事件级别 事件类别 事件审批 故障复盘 父主题: 流程管理
流程管理 概述 事件流程 问题流程 变更场景 父主题: 基础配置
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
批量重装操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重装操作系统功能,您可以对ECS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量重装操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L重装操作系统功能,您可以对Flexus L实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。
某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单
集成管理 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务
在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面问题流程>问题审批,可配置问题降级和问题挂起的审批流程。系统默认问题降级和挂起需要创单人审批 图1 问题审批 单击“新建问题审批”配置问题降级或问题挂起的流程,选择问题流程、问题级别和审批配置。 图2 新建问题审批流程 配置完成后在问题处理页面进行问题单降级和问题单挂起。
故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。 修改规则 仅管理账号可修改复盘规则。 默认规则: 启动Warroom的事件单,P1
在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面问题流程>问题级别。 图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程
问题类型 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>问题类型,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 问题类型 若不使用系统预置的问题类型,可将是否开启列表中开关关闭。若需要新增问题类型,单击“新增问题类型”,添加问题类
批量切换操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L切换操作系统功能,您可以对Flexus L实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
批量切换操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS切换操作系统功能,您可以对ECS实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过