检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。
metric_name 是 String 告警模板添加的监控指标,如弹性云服务器可添加的监控指标为cpu_util等。 各资源的监控指标名称可查看支持监控的服务列表。 condition 是 Condition object 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level
单击不同告警等级的规则条数,可以跳转至告警规则页面,显示所有该告警等级的所有告警规则。 在告警规则页面,单击“查看资源详情”,根据资源ID到相应云服务控制台查找具体资源进行处理。 主机监控 主机监控展示当前所有弹性云服务器的CPU利用率分布图、最近五分钟CPU利用率Top5,
资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimension_name String 否 自定义告警模板选择的资源维度,例如弹性云服务器维度为instance_id。各服务的监控维度可查看支持监控的服务列表。 template_items
合成一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。 解决方法 将请求参数监控周期按照接口文档给出的枚举值选择小点的监控周期。 使用查询监控数据接口查询指标数据(仅支
服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。 请将Ag
POST请求发送周期应小于最小聚合周期,否则会出现聚合数据点不连续。例如:聚合周期为5分钟,发送周期为7分钟,则5分钟情况的聚合数据会出现每10分钟才出现一个点。 POST请求体中时间戳(collect_time)的值必须从当前时间的前三天到当前时间后的十分钟之内某一时间,如果不在这个范围内,则不允许插入指标数据。
min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 说明: 聚合运算的过程是将一个聚合周期范围内的数据点根据相应的聚合算法聚合到周期起始边界上,以5分钟聚合周期为例:假设当前时间点为10:35,则10:30~10:35之间的原始数据会被聚合到10:30这个时间点。
www.example.com 监控频率 站点监控探测引擎执行一次探测任务的时间间隔。 说明: 监控频率可设置为1分钟、5分钟、20分钟。 1分钟 分布式探测点 目前站点监控支持的探测点有:华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)、华南(广州)IPv6。
录,则休眠20分钟,休眠期间,不会采集监控数据。 当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。
String 告警类型。支持的枚举类型: EVENT.SYS:针对系统事件的告警规则。 EVENT.CUSTOM:针对自定义事件的告警规则。 RESOURCE_GROUP:针对资源分组的告警规则。 alarm_actions 否 Arrays of objects 告警触发的动作。 结构样例如下:
事件内容,最大长度4096。 group_id 否 String 所属分组。 资源分组对应的ID,必须是已存在的分组ID。 分组ID查询方法: 登录管理控制台。 单击“云监控服务”。 单击页面左侧的“资源分组”。 在名称/ID列获取具体资源分组ID。 resource_id 否 String
metric_name 是 String 告警模板添加的监控指标,如弹性云服务器可添加的监控指标为cpu_util等,各资源的监控指标名称可查看支持监控的服务列表。 condition 是 Condition object 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level
基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 Agent访问声明
告警 告警规则在何种情况下会触发“数据不足”? 带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 父主题: 故障排查
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
可; 1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各个云服务的指标原始周期可以参考“支持服务列表”,300代表指标按5分钟聚合周期为一个数据点参与告警计算。 最小值:0 最大值:86400 枚举值: 0 1
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。