检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改起会规则 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在“起会规则”列表,选择需要修改的起会规则,单击“编辑” 修改起会规则。输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后
流转规则 概述 流转规则 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置
诊断工具 OS诊断 父主题: 故障管理
OS诊断 登录COC。 在左侧菜单栏单击“故障管理 > 诊断工具”,在“OS诊断”模块单击“立即诊断”,进入“创建OS诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。 图2 选择实例 在“创建
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
排班管理 排班管理概述 排班场景管理 父主题: 基础配置
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。 父主题:
SLO中断记录 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“中断记录”,进入“中断记录”页面。 图1 中断记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据
事件类别 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息
问题级别 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面问题流程>问题级别。 图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程
批量ECS操作 ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维
总览 为用户提供资源健康度、资源监控信息、安全概览、运维能力、系统公告等相关信息,呈现基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
问题流程 问题级别 问题类型 问题审批 父主题: 流程管理
变更场景 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置的变更场景,可将是否开启列表中开关关闭。若需要新增变更场景,单击“新增变更场景”,添加变更场景信息
资源运维常见问题 补丁管理常见问题 自动化运维常见问题 批量操作常见问题 参数管理常见问题 资源运维权限和授权项说明
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题