检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
韧性中心 混沌演练 应急预案 PRR评审 应用韧性评估
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理
WarRoom WarRoom状态 故障信息 影响应用管理 与会成员 进展通告 父主题: 故障管理
资源管理 资源管理 应用管理
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过云运维中心查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“
与会成员 操作场景 与会成员主要是为了快速恢复故障,将参与故障恢复的人员拉入群组,或通过电话或短信及时通知故障恢复人员响应并处理故障。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom
、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而成。通过访问密钥(AK/SK)认证方式进行认证鉴权,即使用Access
Management Service,TMS)用于用户在云平台通过统一的标签管理各种自定义作业。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的自定义作业较多时,可以通过标签管理服务管理账户下的自定义作业。 建议您先在TMS系统中设置预定义标签。
应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
首次安装UniAgent如何操作? 登录COC。 在左侧菜单栏单击“应用资源管理”,进入“资源管理”页面,选中首台未安装过UniAgent的机器。 图1 安装UniAgent 在跳转的安装UniAgent页面中,单击 “手动安装”。 图2 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
注意事项 暂不支持查看阿里云资源详情。 IDC离线资源仅支持查看虚拟机资源详情。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要查看资源所在的云厂商。 默认选择“华为云”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击实例名称。
(MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要查看资源所在的云厂商。 默认选择“华为云”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击操作列“查看拓扑”。
告警转事件 操作场景 通过云运维中心将指定汇聚告警转为事件。 转为事件后会生成相应的事件单,可以在关联事件单号这一列查看事件单信息。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾
演练规划 操作场景 创建演练规划时您可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理
在下拉列表中选择企业项目,支持选择“全部”。 视图类型 CMDB资源视角 请选择视图类型。 CMDB资源视角:以资源视角选择实例列表。 CMDB应用视角:以应用视角选择实例列表。 资源类型 ECS 可选项“ECS”、“BMS”。 区域 - 从下拉列表中选择区域。 目标实例 - 在筛选框设置条件,选择筛选出的实例。
补丁自动化操作 操作场景 补丁扫描或补丁修复支持创建自动化任务,您可通过自动化任务定时执行补丁扫描或补丁修复作业。 补丁自动化操作 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“补丁管理”,进入“补丁管理”页面。