检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
启动WarRoom 操作场景 重大事件需启动WarRoom攻关,进行拉会处理事件,事件可快速恢复。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2
处理事件 操作场景 受理事件后处理事件单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 若流转规则创建的事件单关联了响应预案,在处理事件单过程中可执行响应预案。单击页面中“执行响应预案”跳转至“执行响应预案”页面。
同步资源 提供用户同步资源的能力,资源数据支持页面的条件过滤及字段显示控制。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权
手动关联资源 提供用户在对应分组下来关联资源的能力,将对应资源数据关联至某一应用的分组内进行管理。 操作场景 通过Cloud Operations Center关联资源到应用下的指定分组中。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管
告警转事件 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“转事件”或“批量转事件”。 相同区域的告警才能批量转事件。 输入事件相关信息,单击“确定” 图1 告警转事件 事件的参数说明,参考创建事件。
如何使用人员管理 本文介绍如何使用人员管理模块。 添加用户操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员 编辑用户信息操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,选择需要编辑的人员在对应行“操作”列单击“编辑”。
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
查看帐号密码 获取帐号密码 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并已绑定应用的主机。 图1 帐号管理概览
批量切换操作系统 操作场景 通过Cloud Operations Center ECS操作批量切换操作系统功能进行ECS实例批量切换系统。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择
批量重装操作系统 操作场景 通过Cloud Operations Center FlexusL操作批量重装功能进行Flexus L实例操作系统批量重装。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择
选择“分批策略”和“熔断策略”。 可根据业务选择是否勾选入库人工审核。 图20 编辑人工审核 根据业务选择是否开启消息通知,开启时,勾选通知策略,选中通知对象和通知渠道。 图21 编辑通知 单击“提交”,即可成功创建定时任务。 执行的作业和脚本可在本服务左侧菜单“自动化运维”>“作业管理”和“脚本管理”模块中进行设置。
默认用户为root,超时时间为300秒。 脚本参数支持手动输入和参数仓库两种(清理磁盘暂不支持)。手动输入时需要用自行填写参数值;从参数中心选择时,需要选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式
获取自定义脚本详情 功能介绍 获取脚本详情 约束条件: 只能查询自定义脚本详情 URI GET /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 无 响应参数
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
导入IDC离线资源 提供用户导入IDC离线资源的能力。 操作场景 通过Cloud Operations Center导入线下IDC离线资源。 操作步骤 登录COC。 在“多云配置”页面中单击“IDC离线资源”。 图1 导入IDC离线资源 单击“下载模板”,下载表格模板录入信息。 图2
批量重装操作系统 操作场景 通过Cloud Operations Center BMS操作批量重装功能进行BMS实例操作系统批量重装。 注意事项 已开机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量BMS操作”模块中单
事件创建改进单 操作场景 事件单受理过程发现该故障有改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 在页面的右侧点击选择创建改
受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示
查看资源拓扑 提供用户查看资源拓扑关系的操作。 操作场景 通过Cloud Operations Center查看资源拓扑关系。 注意事项 目前仅支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)以上四种资源的拓扑关系。
驳回事件 操作场景 创建的事件不合理时,事件处理人可驳回事件。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 待处理事件列表 单击“驳回”。 图2 驳回事件 填写驳回原因,单击“确定”。 图3 填写驳回原因