检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
完成问题单挂起审批。若挂起审批通过,问题单状态为“挂起”;若挂起审批未通过,问题单状态为发起挂起时的状态。 挂起恢复 挂起恢复需要问题创建人操作。 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要处理的问题单,单击问题单标题。
3.问题单闭环之前需要将升降级和挂起的电子流闭环 4.问题单升级无需审批 父主题: 问题流程
通知规则-级别 否 可多选 选择事件单的等级,分别为 P1-P5共五个级别(事件单级别解释参考创建事件) 通知规则-事件类别 否 可多选 选择事件单的类别,有多个值供选择 通知规则-来源 否 可多选 选择事件单的来源,人工创建为在事件单中心创建事件单,流转创建为流转过程中产生的事件单
设置“修改事件单”。 表1 修改事件单参数说明 参数 说明 事件名称 根据命名规则,自定义事件的名称。 事件描述 对事件进行描述。 上传附件 单击“添加文件”上传事件相关附件。
变更日历 操作场景 变更单创建后,可以通过变更日历查看变更单的分布和详情,支持按月和日展示,具体操作如下。 查看日历 登录云运维中心。 在左侧导航栏选择“变更管理 >变更日历”。 页面默认显示本月审批后的变更分布,单击变更标题可进入变更单详情页面。
手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。
完成问题单创建,问题单状态为“未受理”。 父主题: 问题管理
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 问题单状态为“被驳回”。 父主题: 问题管理
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 问题管理流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。
注意事项 确认事件单的内容,并如实填写事件等级。 创建事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击右上方“创建事件单”。 设置“创建事件单”。 表1 创建事件单参数说明 参数 说明 事件名称 自定义事件的名称。 事件描述 对事件进行描述。
运维概览 操作场景 通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。
支持事件单/告警单/待办任务/问题单4类工单。 支持设定SLA目标(工单需要在指定时间内完结某状态),当工单触发规则后,按指定方式通知指定的人员,且支持持续通知。 支持设定SLA预警目标,即将打破SLA时,提前指定时间发送通知。
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。
默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。
修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单击操作列“编辑”修改事件级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。
变更单状态校验: (1)提权应用,Region必须与变更单中的一致; (2)此次提权的操作人必须是变更单的实施人; (3)当前操作时间必须在变更单的计划实施时间窗内(当前操作时间必须大于计划开始时间且小于计划结束时间); (4)变更单必须点击【变更开始】 开启工单提权后,北向接口无法使用