检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
API方式 如果用户需要将云服务平台上的云运维中心集成到第三方系统,用于二次开发,请使用API方式访问云运维中心,具体操作请参见《云运维中心API参考》。 控制台方式 其他相关操作,请使用管理控制台方式访问云运维中心。
自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。 启用、禁用集成 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 单击监控源的“启用/禁用”。 对接入源进行启用或者禁用操作。 更新集成标识 登录云运维中心。
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
集成管理 概述 集成管理 父主题: 故障管理
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。
确保已接入CES监控,请到集成管理进行配置。 已创建事件单。 如果需要展示CCE集群中的负载,pod信息,需要在CCE中对负载进行标签配置(每个分组只能添加一个CCE集群资源,否则不展示负载等信息)。 图1 配置CCE负载标签 应用诊断 登录云运维中心。
快捷混沌演练 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。
图2 接入集成 在接入集成页面,按照集成接入步骤,完成告警接入配置。 图3 集成接入步骤 完成告警接入配置,单击“确认集成”。 图4 确认集成 步骤二:创建流转规则,清洗原始告警数据 登录COC。 在左侧导航栏选择“故障管理 > 流转规则”,进入“流转规则”页面。
资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权限将用于调用RMS服务接口,获取当前用户所属的所有Region下资源数据。
前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 单击右上方“新增规则”。 若两个流转规则中的信息较相似,可单击操作列“复制”,快速创建流转规则。 设置“基本信息”。
本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。
产品优势 一站式运维平台 提供集成式运维能力,支持集中管控和运维。 ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。
产品功能 云运维中心COC提供的常用功能特性参见表1 云运维中心COC功能概览。 表1 云运维中心COC功能概览 功能名称 功能描述 发布区域 总览 COC全局总览页面,包含资源总览、资源监控、应用监控、安全概览、快捷入口等多个板块。
集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。 父主题: 故障管理常见问题
故障管理 事件管理 WarRoom 集成管理 父主题: API
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。
查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 历史告警”。 查看集成告警列表信息。 选择需要查看的告警单击操作列 “更多 > 历史记录” 。 查看当前告警单历史记录。 父主题: 告警管理
故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题