检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运维概览 操作场景 通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
展示批次列表 功能介绍 查询:批次列表 返回:批次index、批次标签 URI GET /v1/job/script/orders/{execute_uuid}/batches 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的
变更管控 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。 前提条件 开启变更管控需要申请IAM权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:p
展示实例状态统计信息 功能介绍 查询:实例状态统计信息。 URI GET /v1/job/script/orders/{execute_uuid}/statistics 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
操作脚本工单 功能介绍 操作类型:取消实例、跳过批次、取消整个工单、暂停整个工单、继续整个工单 URI PUT /v1/job/script/orders/{execute_uuid}/operation 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是
查询脚本列表 功能介绍 作业脚本列表:自定义脚本 limit最大为100 URI GET /v1/job/scripts 表1 Query参数 参数 是否必选 参数类型 描述 limit 是 Integer 分页参数:每页返回记录个数限制 最小值:1 最大值:100 marker
展示批次详情 功能介绍 查询:批次详情,分页获取批次中的实例列表。 过滤条件:分页参数 URI GET /v1/job/script/orders/{execute_uuid}/batches/{batch_index} 表1 路径参数 参数 是否必选 参数类型 描述 batch_index
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
参数管理的页面权限? 权限设计 访问参数列表页:需要list权限: coc:parameter:list 获取参数详情:需要get权限:coc:parameter:get 删除参数:需要操作类权限:coc:parameter:delete 创建参数:需要操作类权限:coc:parameter:create
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
执行命令 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS执行命令功能,您可以在不登录ECS的情况下,发送脚本命令至单台或多台ECS,快速完成对ECS的日常维护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行
概述 变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理
应用诊断 操作场景 当事件创建后,您可以通过应用诊断(全链路故障诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
展示工单列表 功能介绍 查询作业工单列表,分页查询 过滤:创建时间开始,创建时间结束、创建人 返回:id、脚本名称、区域、创建人、创建时间、结束时间、总耗时、状态 URI GET /v1/job/script/orders 表1 Query参数 参数 是否必选 参数类型 描述 limit