检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES Exporter。 具体操作请参考安装配置CES Exporter。 下载、安装并配置Prometheus。 具
修改、删除、启用、停用数据转储 当业务变化或者之前配置的数据转储配置不符合您的业务需求时,您可参考本章节修改、停用、启用或删除数据转储任务。 修改数据转储任务 登录管理控制台。 单击“服务列表 > 云监控服务”。 在左侧导航树中选择“数据转储”。 单击数据转储任务所在行“操作”列的“修改”,进入“修改转储任务”界面。
创建/修改/删除通知策略 通知策略能够配置分级和排班策略,能够在策略中配置接收对象和通知内容模板。 创建通知策略 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知策略”页签,单击“创建通知策略”,根据界面提示配置参数。 图1 创建通知策略
在“修改屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。
告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
保持不变 告警级别 保持不变 告警持续时长 保持不变 告警时间 保持不变 告警流水号 保持不变 当前数据 保持不变 区域 删除 IP 删除 ELB异常主机 删除 表2 短信-系统事件系统通知模板 信息 变更操作 资源名称 新增 资源ID 新增 持续时长 新增 用户名 新增 链接 新增
云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知内容模板”页签,单击“创建通知内容模板”,根据界面提示配置参数。 根据界面提示,配置告警通知内容模板的基本信息。 图1 基本信息 表1 基本信息 参数 参数说明 模板名称 系统会随机产生一个通知模板名称,用户也可以进行修改。
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /u
单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 屏蔽方式 根据需要可选择资源屏蔽、策略屏蔽或事件屏蔽的方式。 云产品
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 广域网质量监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置广域网质量监控的告警内容
可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录CES的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CES支持审计的操作事件请参见云审计服务支持的Cloud Eye操作列表。
告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资
大盘详情中配置监控视图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“我的看板 > 监控大盘”。 在“监控大盘”界面,单击操作列的“查看”,进入云服务监控大盘页面。 在云服务监控大盘页面,可以查看监控大盘的监控视图。同时支持添加、配置、删除监控
云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 在“监控任务”页面,单击“创建任务”。 根据界面提示,配置广域网质量监控的基础信息。 图1 填写基础信息 表1 配置基本信息 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 availabilityMonitor-wi4t
修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。 进入“修改监控站点”界面。 根据界面提示配置参数,参数如表1所示。 站点类型与站点地址不能修改,因不同站点类型高级配置信息不同,切换后可能会丢失数据。 单击“确定”,完成修改。 停用站点监控 在“站点监控”界面,单击站点所在行的“更多 > 停用站点
管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则、监控视图,极大的降低运维复杂度,提高运维效率。 前提条件 在进行资源分组配置前,如需使用资源标签匹配能力,请确保您的资源打
上述命令斜体部分192.168.0.1为云服务器的网关,请根据实际情况修改配置。 问题是否解决? 解决:排查结束。 未解决:执行7。 打开Agent安装包存放目录bin/conf_ces.json配置文件。 获取Agent配置文件中的Endpoint。 {"Endpoint":"https://ces
ficientdata_actions(该参数已废弃,建议无需配置)、ok_actions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警