检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上限时
修改应用 操作场景 应用创建后,若想对应用的名称或描述进行修改,请按如下操作进行。 修改应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要修改的应用,单击。 设置“编辑应用”。 表1 编辑应用参数说明 参数 说明
SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响
受理事件 操作场景 事件创建后,事件责任人分析事件实际情况,若属实则事件责任人受理事件并进行后续处理,完成事件的闭环。 受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理
升降级 操作场景 如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级
升降级 操作场景 创建人提交问题后,若问题处理人认为当前问题级别不合理,可对问题单进行升降级操作,问题单升降级流程可在流程管理中配置。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“升降级
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和启动了
转发问题 操作场景 问题单处理过程发现该问题属于其他运维专家处理,可转发问题单给对应的责任人。 转发问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表
查看SLO 操作场景 用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值
展示批次详情 功能介绍 查询:批次详情,分页获取批次中的实例列表。 过滤条件:分页参数 URI GET /v1/job/script/orders/{execute_uuid}/batches/{batch_index} 表1 路径参数 参数 是否必选 参数类型 描述 batch_index
启动WarRoom 操作场景 事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题
创建应用 操作场景 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。创建应用后,即可为该应用添加子应用、组件等信息。 注意事项 应用结构类型选择大型应用时支持配置子应用。 应用或子应用下同级节点不能同时存在子应用和组件。 创建应用 登录云运维中心。 在左侧导航栏选择“
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3
PRR模板管理 操作场景 PRR模板管理支持用户创建、编辑、删除以及查看 PRR模板。 用户可以通过PRR模板管理进行模板的制定、评审等操作。 创建PRR模板 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,单击“PRR模板管理”,进入“PRR模板管理”页面。 图1
开始评估 操作场景 当您需要对应用韧性评估任务进行评估时,请按如下操作进行。 若评估状态为“未评估”,详细操作请参考开始评估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告
删除应用 操作场景 应用创建后,若想删除应用或子应用,请按如下操作进行。 注意事项 当应用或子应用下存在分组、组件或子应用时,此应用或子应用无法删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”
创建分组 操作场景 创建组件后,若想在组件下创建分组,请按如下操作进行。 创建分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择组件,单击。 设置“创建分组”。 表1 创建分组参数说明 参数 说明 示例
评估报告 操作场景 应用韧性评估任务完成后,若想查看评估结果详情,请按如下操作进行。 注意事项 应用的评估状态为“评估完成”时才可以查看评估报告。 查看评估报告 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“查看报告”。 查看最新的评估报告详情。
创建流转规则 操作场景 用户通过流转规则可以实现事件、告警等规则的自定义配置。通过配置流转规则,将原始告警转成汇聚告警或事件。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。