检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
选择私有镜像“Image_with_agent” 创建ECS实例后,登录ECS,修改Agent配置文件(/usr/local/telescope/bin/conf.json)中的InstanceId为对应ECS的ID,即可完成复制流程,如图5所示。 图5 修改Agent配置文件 父主题: 主机监控
单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数。 事件名称分别配置因硬件故障触发重启、因硬件故障重启已完成,具体参数说明请参见创建告警规则。 配置完成后,单击“立即创建”,完成创建告警规则。 告警通知”功能触发产生的告警消息由消息通知服
考产品价格说明。 根据界面提示,配置归属企业项目。 图3 高级配置 表1 配置归属企业项目 参数 参数说明 归属企业项目 告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。创建企业项目请参考:创建企业项目。 配置完成后,单击“确定”,完成资源分组关联告警模板。
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 站点监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置站点监控的告警内容 表2
统。 前提条件 已完成云监控主机监控Agent的安装,请参考Linux系统。 已完成插件修复。 已获取待安装插件的弹性云服务器的root密码。 使用一键安装脚本配置插件 华为云部分区域支持使用一键安装脚本来配置插件,目前支持一键安装脚本的区域如表2所示。 使用root账号,登录ECS。
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 监控频率建议设置为1分钟,更多参数说明如配置参数所示。 配置完成后,单击“确定”,完成创建站点监控。 单击站点监控所在行右侧“操作”列下的“创建告警规则”。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 响
在“创建告警规则”界面,根据界面提示配置参数。 监控对象为当前的ECS,无需配置。 选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。 以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。 配置完成后,单击“立即创建”,完成创建告警规则。
应时间时延,了解不同地域运营商的用户访问时延体验,可为系统部署架构优化提供参考依据。 网络可用性分析 通过使用广域网质量监控功能配置定时PING探测任务,根据需要选择发起探测的不同国家地域的运营商探测节点,运行一段时间后可以观察到不同国家地域的运营商线路到目标服务的网络时延情况。
这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 配置完成后,单击“立即创建”,完成创建告警规则。 当
metheus后,您可以利用Grafana更好地分析和展示来自Cloudeye服务的数据。 前提条件 已安装配置CES Exporter。 操作步骤 下载Prometheus软件,下载地址请参见https://prometheus.io/download/。 配置Promethe
在“修改屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。
要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 Cloud Eye部署时通过物理区域划分,为项目级服务,需要在各区域(如华北-北京1)对应的项目(cn-north-1)中设置
创建/修改/删除通知策略 通知策略能够配置分级和排班策略,能够在策略中配置接收对象和通知内容模板。本章节介绍如何创建、修改和删除通知策略。 创建通知策略 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知策略”页签,单击
告警 告警规则在何种情况下会触发“数据不足”? 带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警?
告警配置方式 配置指标告警
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 广域网质量监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置广域网质量监控的告警内容
Agent)磁盘使用率可配置“平均值≥80%”、告警级别为重要的告警规则。同时配置“平均值≥90%”、告警级别为紧急的告警规则。 配置伸缩策略 单击“计算 > 弹性伸缩”。 在弹性伸缩组页面,单击“创建弹性伸缩组”,创建伸缩组请参见创建伸缩组。 创建完成后,单击伸缩组所在行的“查看伸缩策略”。