检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。
创建问题 操作场景 通过Cloud Operations Center创建一个问题单。 前提条件 需要先在应用管理中创建您的应用。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。
升降级 操作场景 创建人提交问题后,若问题处理人认为当前问题级别不合理,可对问题单进行升降级操作。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“升降级”,页面会显示问题挂起弹窗页面,并填写挂起信息。
COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器L实例(HCSS)两种攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 以下是BMS、HCSS各镜像版本与支持的探针类武器声明:
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
查看容量排名 提供用户查看已关联的资源容量排名的能力。 操作场景 通过Cloud Operations Center查看已关联的资源容量排名。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,单击“容量”。 图1
添加备注 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“添加备注”。 图2 添加备注 填写备注信息后,单击“提交”。 图3 填写备注信息 父主题: 处理事件
验证事件 操作场景 事件单处理完成后,验证事件是否处理完成。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入页面详情 单击“验证关闭”。 图2 验证关闭事件 填写验证信息后,单击“确定。 图3
事件历史记录 操作场景 可以查看事件的历史记录,包含事件的整个处理过程。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件页面详情 单击“ 事件历史”查看事件历史记录。 图2 查看事件历史记录
驳回事件 操作场景 创建的事件不合理时,事件处理人可驳回事件。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 待处理事件列表 单击“驳回”。 图2 驳回事件 填写驳回原因,单击“确定”。 图3 填写驳回原因
提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num
执行UniAgent操作 提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。
升降级 操作场景 事件单等级与实际情况不符,只有在事件受理后才能修改事件级别。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“升降级”。 图2 升降级事件
启动WarRoom 操作场景 重大事件需启动WarRoom攻关,进行拉会处理事件,事件可快速恢复。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2
处理事件 操作场景 受理事件后处理事件单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 若流转规则创建的事件单关联了响应预案,在处理事件单过程中可执行响应预案。单击页面中“执行响应预案”跳转至“执行响应预案”页面。
执行UniAgent操作 提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。
创建事件单 功能介绍 创建事件单 URI POST /v1/external/incident/create 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 region 否 Array of strings 区域Code,如果自动拉起WarRoom则为必填,现在只支持1个
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
历史告警 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 图1 历史告警列表 在集成告警列表“操作”列选择 “更多 > 历史记录” 可查看当前告警单历史记录。 图2 告警单历史记录 父主题: 汇聚告警
问题定位出方案中 操作场景 问题单受理后,需要对该问题进行定位分析,并给出定位结果和解决方案。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“定位出方案”,跳转至填写问题原因及解决方案页面,填写信息后点击提交。