检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
变更中心 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤8,执行步骤9。 设置“执行作业”。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:所有任务在所选目标实例执行,统一使用一个分批策略。 每个步骤独立:单个步骤下的任务在
别)。 通知规则-事件类别 否 可多选 选择事件单的类别,有多个值供选择。 通知规则-来源 否 可多选 选择事件单的来源,人工创建为在事件单中心创建事件单,流转创建为流转过程中产生的事件单。 通知规则-区域 否 可多选 选择事件单的区域,多个区域可选。 通知方式 是 可多选 选择通知的渠道。
必选参数。 触发类型有: 事件单 告警单 待办任务 问题单 选择级别 当触发类型为事件单,级别有 P1 P2 P3 P4 P5 当触发类型为告警单,级别有 紧急 重要 次要 提示 当触发类型为待办任务,级别有 紧急 重要 次要 提示 当触发类型为问题单,级别有 致命 严重 一般 提示
可以查询处理记录。 处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题: 问题管理
记录包含事件的整个处理过程。 事件历史记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要查看的事件单,单击事件标题。 单击上方“事件历史”。 父主题: 事件管理
中修改。 故障复盘 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击“全部事件单”页签。 选择需要复盘的事件单,单击故障报告/状态列“故障报告”。 系统会将事件单的基本信息自动填充至复盘信息中,如故障现象,故障处理过程、故障原因等,并支持编辑。 单击右上方“编辑报告”。
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
进入演练报告详情页面,输入演练时长,单击“确认”。 图5 编辑演练时长 在“演练报告”页面,单击“创建改进事项”,输入改进事项相关信息,单击“确认”保存创建改进单。改进单后续处理参考改进管理。 图6 创建改进事项 表1 改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用
事件管理 概述 创建事件 驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
展及时同步给相关人员,请参考进展通告操作。 故障处理过程中如果识别到一些产品、运维或管理改进事项,可以创建改进单,并通过改进管理处理。 前提条件 需要有正在处理的事件单,在事件处理页面启动WarRoom。 父主题: WarRoom
人可重新编辑提交或闭环。 驳回事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 父主题: 事件管理
事件受理后才能添加备注。 添加备注 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“... > 添加备注”。 设置“添加备注”。 备注:请填写备注。 单击“确定”。 完成事件备注添加。 父主题:
续处理,完成事件的闭环。 受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理,事件状态变更为“已受理”。 父主题: 事件管理
Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。 多AZ容灾 COC支持跨AZ容灾,当一个AZ异常时,不影响COC实例持续提供服务。
若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息。添加后可在事件管理>创建事件单页面中事件类别查看最新的枚举值。 图2 新建事件类别 父主题: 事件流程
本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。 注意,初始生成的汇聚告
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“升降级”。 设置“升降级”。 表1 升降级参数说明 参数 说明 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。
快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“启动WarRoom”。 设置“启动WarRoom”。 表1 启动WarRoom参数说明 参数 说明 WarRoom名称