检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性公网IP和带宽”,单击具体带宽或弹性IP所在行的“创建告警规则”。 建议针对业务所涉及的弹性公网IP、带宽配置告警规则,出网带宽使用率,阈值设置为“原始值”“≥”购买带宽的90%。 根据界面提示配置名称、描述和告警规则和告警通知参数。 单击“立即创建”,完成创建告警规则。 告警通知”功能触发
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 主机监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 表2 主机监控告警内容配置说明 参数 参数说明
改”。 在弹出的“修改告警规则”页面中修改告警规则配置参数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围是“全部资源”时,可单击“选择排除资源”排除指定资源。其它参数请参考5进行配置。 单击“立即修改”,完成告警规则的修改。 父主题:
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
企业项目的子用户在配置告警规则时,无法选择全部资源 配置告警规则可选择全部资源的功能只有主账号或配置了Tenant Administrator权限的子用户才有权使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
主机监控界面单击一键配置时提示权限不足该如何处理? 问题现象 使用IAM子账号配置主机监控时,单击“一键配置”提示权限不足。 可能原因 子账号未配置IAM委托相关权限 解决方法 添加查询委托权限策略。 以主账户或子账号(拥有创建自定义策略和给其他子账号授权的权限)登录华为云管理控制台。
批量安装Agent 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 确保已下载Agent安装脚本,获取脚本的方式如下: 表1 获取Linux镜像的Agent安装脚本 区域 regionID
主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。 修改ECS的DNS配置有两种方式:Windows图形化界面和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 修改DNS(Windows图形化界面)
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 修改DNS(命令行方式)
在“创建告警规则”界面,配置参数。 配置告警规则的基本信息。 表1 事件监控的告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置事件监控的告警内容 表2
Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。
Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达
告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft