检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
最大长度:255 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 provider_code String 服务标识 缺省值:049 最小长度:3 最大长度:100000000 error_code String 请求响应代码,范围:0000~9999,正常时取值:0
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
最大长度:255 incident_title 是 String 事件标题,最大长度:200 最小长度:0 最大长度:200 incident_description 是 String 事件描述,最大长度:600 最小长度:0 最大长度:600 incident_source 是 String 单据来源
删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要删除的应用,单击。 单击“确定”。 完成应用删除。 删除子应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。
再次”重新评估”时,会提示自动删除最老的评估报告,需要用户确认后,才能开启新的评估。 开始评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“评估”。 开始应用韧性评估。 重新评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。
创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。 图2 创建应急预案 表1 应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单
资源操作工单 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 在“资源运维 > 资源批量操作”中执行批量操作任务后,若您需要跟踪和记录任务的执行对象及执行结果,可以在“任务管理 > 执行记录 > 资源操作工单”页面查看。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。 单击需要查看的WarRoom标题。 页
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
操作场景 问题单创建后,发现提交的问题属于非问题或其他原因问题处理人可撤销问题单。撤销问题单前需要先驳回问题,已受理的问题单不可撤销。 撤销问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“撤销”。
添加备注 使用场景 事件处理过程,若存在事件需要添加额外的备注信息,可使用添加备注的功能。 前提条件 事件受理后才能添加备注。 添加备注 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“... >
审批变更单 操作场景 变更单创建后,需审批变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,审批变更单。 图1 审批变更单 父主题: 变更中心
验证说明,最大长度:300 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 provider_code String 服务标识 缺省值:049 最小长度:3 最大长度:100000000 error_code String 请求响应代码,范围:0000~9999,正常时取值:0
问题处理记录 操作场景 问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询处理记录。 处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题:
补丁操作出现lsb_release not found异常如何处理? 1.请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤