检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
演练规划 操作场景 创建演练规划时您可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。
OS诊断 操作场景 OS诊断是基于华为云积累的大量知识经验和特有的检测算法,通过采集少量GuestOS数据,帮您快速了解服务器整体运行状况并准确提供异常问题排查定位方法。 注意事项 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。
响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右上方“修改”。 设置“修改故障信息”。
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
处理告警 操作场景 当汇聚告警生成后,用户可以通过云运维中心快速处理,执行响应方案,支持作业、脚本两种方式。 注意事项 只有责任人可以处理当前告警。 处理告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。 选择需要处理的告警,单击操作列“更多
题实施阶段变更需要审批等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“挂起”。 设置“挂起”。
问题单创建后,发现提交的问题属于非问题或其他原因问题处理人可撤销问题单。撤销问题单前需要先驳回问题,已受理的问题单不可撤销。 撤销问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“撤销”。 填写撤销原因,单击“确定”。
需要在CCE中对负载进行标签配置(每个分组只能添加一个CCE集群资源,否则不展示负载等信息)。 图1 配置CCE负载标签 应用诊断 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要诊断的事件单,单击事件标题。 单击上方“应用诊断”。
添加备注 使用场景 事件处理过程,若存在事件需要添加额外的备注信息,可使用添加备注的功能。 前提条件 事件受理后才能添加备注。 添加备注 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“... > 添加备注”。
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
批量RDS操作 批量开启 批量停止 批量重启 父主题: 资源批量操作
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。
与其他云服务的关联 云运维中心COC服务与其他服务的关系,如图1所示。 图1 与其他服务的关系 表1 与其他服务的关系 服务名称 与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。
签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。 选择需要清除的告警,单击操作列“清除”。 设置“清除告警”。
事件流程 事件级别 事件类别 事件审批 故障复盘 父主题: 流程管理
通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 在“原始告警”页签,单击告警名称。 查看原始告警详情。 父主题: 告警管理