检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。
在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 在“作业管理”页面,选择“自定义作业”页签,在作业列表单击,单击“编辑标签”。 按照创建标签的步骤进行操作,单击“确定”。 图2 编辑标签 父主题: 作业管理
密钥管理 帐号基线 改密策略 改密任务 查看帐号密码 父主题: 自动化运维
rpm 补丁基线 补丁扫描 补丁修复 补丁合规性报告详情摘要 补丁自动化操作 父主题: 自动化运维
密钥管理 配置密钥 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 在页面右上角点击“密钥管理”按钮,或者通过“帐号管理流程引导”标签下方的“配置密钥”下“立即配置”按钮。
脚本管理 提供用户自定义脚本的创建、修改、删除以及在目标虚拟机上执行自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例上执行操作。 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
参数管理 参数中心 通知规则 父主题: 自动化运维
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。
集成管理 父主题: 故障管理
告警管理 汇聚告警 原始告警 父主题: 故障管理
在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”页面。 在“集成管理”页面单击“接入源”,进入接入源详情后,在下面的“集成标识”部分,单击后面的更新集成标识。 图3 更新集成标识 父主题: 集成管理
改进管理 前提条件 需要通过事件/Warrroom/演练/PRR创建改进单。 处理改进单 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,单击改进标题进入“改进单详情”页面。
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy 云运维中心服务只读权限。 系统策略 COCFullAccessPolicy 云运维中心服务管理员权限。
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。
执行公共作业 创建自定义作业 管理自定义作业 执行自定义作业 标签管理 原子动作 父主题: 自动化运维
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
", "data" : null, "provider_code" : "049" } 状态码 状态码 描述 200 请求成功 400 请求体有误 401 鉴权有误 父主题: 故障管理
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。