检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题: 问题管理
禁用规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要禁用的规则,单击操作列“禁用”。 单击“确定”。 完成流转规则禁用。 启用规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要启用的规则,单击操作列“启用”。
审批变更单 操作场景 变更单创建后,需审批变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,审批变更单。 图1 审批变更单 父主题: 变更中心
概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。
云运维中心支持将清除告警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。
操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 在“原始告警”页签,单击告警名称。 查看原始告警详情。 父主题: 告警管理
添加与会成员 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“邀请”。 设置“邀请”。 表1 邀请参数说明 参数 说明 与会方式 可选参数,可选项“企业微信”、“钉钉”、“飞书”。
驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 问题单状态为“被驳回”。 父主题: 问题管理
概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。
公共预案 操作场景 您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图
查询WarRoom信息 功能介绍 查询warroom信息 URI POST /v1/external/warrooms/list 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 limit 否 Long limit 最小值:0 最大值:1000 缺省值:0 offset
创建排班 使用场景 事件、变更等场景需获取排班中的人员作为责任人,可通过创建排班场景及角色进行人员管理。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班角色后单击
演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录和管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表
重新提交 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“修改”。 设置“修改”。 表1 修改参数说明 参数 说明 问题标题 自定义问题的标题。
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。
查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 历史告警”。 查看集成告警列表信息。 选择需要查看的告警单击操作列 “更多 > 历史记录” 。 查看当前告警单历史记录。 父主题: 告警管理
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表1 转发责任人参数说明 参数 说明 转发责任人 可选项“排班”、“个人”。
验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。