检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
演练报告 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”列表。在演练记录列表“操作”列,单击
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
变更配置 变更配置概述 承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。 审批配置:支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 审批配置 父主题: 变更管理
处理问题 操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
受理问题 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“受理”,受理后可对问题单进行分析定位。 父主题: 处理问题
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件流程 创建事件 处理事件 事件历史记录
事件类别 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类
产品功能 云运维中心COC提供的常用功能特性参见表1 云运维中心COC功能概览 表1 云运维中心COC功能概览 功能名称 功能描述 发布区域 总览 COC全局总览页面,包含资源总览、资源监控、应用监控、安全概览、快捷入口等多个板块。用户可以在总览页面便捷查看、处理工作项,降低运维复杂度,改善运维体验。
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
启动WarRoom 操作场景 重大事件需启动WarRoom攻关,进行拉会处理事件,事件可快速恢复。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2
清除告警 操作场景 通过云运维中心清除指定汇聚告警。 清除后的汇聚告警会在历史告警页签中找到。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“清除”或“批量清除”。
告警管理概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇
作业工单 提供用户查看、操作作业工单的能力。 前提条件 用户下发了执行作业的任务,系统生成对应的作业工单。 操作场景 通过Cloud Operations Center查看作业工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“
执行公共作业 操作场景 公共作业是云运维中心提供的预定义作业,用户对公共作业具有只读和执行权限,作业管理提供基础的公共作业列表,支持在目标资源执行公共作业。 注意事项 在执行公共作业前需要确认是否拥有目标实例的资源权限。 执行公共作业 登录云运维中心。 在左侧导航栏选择“资源管理
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
修改脚本 功能介绍 修改作业脚本:自定义脚本 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。 脚本内容最大4096个字符。 脚本参数个数最多20个。 脚本描述:最大256个字符。 单个参数的参数名称 64个字符,只支持字母+数字+下划线。
接入其他云厂商 操作场景 云运维中心支持对友商云账号进行配置,同步友商云资源,当前已支持的友商云有:阿里云、AWS。当您需要通过云运维中心管理其他友商云资源时,请按如下操作进行。 注意事项 当前支持创建阿里云、AWS账号。 新增账号后,需要同步资源,同步当前账号下现有资源。 已有账号的资源产生变化,需要重新同步资源。
创建脚本 功能介绍 创建作业脚本:自定义脚本 脚本有标签属性,表示是高危脚本。创建时候不需要对脚本进行是否是高危的二次校验。 进行租户隔离;北向接口创建的脚本,审批人字段不填写,默认不需要审批 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。
快捷执行作业 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前