云服务器内容精选

  • 返回值 正常 200 异常 返回值 说明 400 Bad Request 请求错误。 401 Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
  • URI GET /V1.0/{project_id}/metric-data?namespace={namespace}&metric_name={metric_name}&dim.{i}=key,value&from={from}&to={to}&period={period}&filter={filter} 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 表2 查询检索参数 名称 是否必选 参数类型 说明 namespace 是 String 服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 metric_name 是 String 指标名称,可通过查询指标列表获取已有的告警规则的指标名。 from 是 String 查询数据起始时间,UNIX时间戳,单位毫秒(ms)。 由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果将from和to的范围设置在聚合周期内,会因为聚合未完成而造成查询数据为空,所以建议from参数相对于当前时间向前偏移至少1个周期。 以5分钟聚合周期为例:假设当前时间点为10:35,10:30~10:35之间的原始数据会被聚合到10:30这个点上,所以查询5分钟数据点时from参数应为10:30。 说明: 云监控 会根据所选择的聚合粒度向前取整from参数。 to 是 String 查询数据截止时间UNIX时间戳,单位毫秒(ms)。from必须小于to。 period 是 Integer 监控数据粒度。 取值范围: 1,实时数据 300,5分钟粒度 1200,20分钟粒度 3600,1小时粒度 14400,4小时粒度 86400,1天粒度 filter 是 String 数据聚合方式,支持的聚合方式如下: average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 说明: 聚合运算的过程是将一个聚合周期范围内的数据点根据相应的聚合算法聚合到周期起始边界上,以5分钟聚合周期为例:假设当前时间点为10:35,则10:30~10:35之间的原始数据会被聚合到10:30这个时间点。 dim 是 String 指标的维度,目前最大支持4个维度,维度编号从0开始;维度格式为dim.{i}=key,value,key的最大长度32,value的最大长度为256。 CloudTable仅支持多维度查询。 以下维度说明仅为实例,具体是否支持多维度请参见各服务中监控指标说明中的维度说明。 单维度:dim.0=instance_id,i-12345 多维度:dim.0=instance_id,i-12345&dim.1=instance_name,i-1234 对于dim字段的内容,可通过调用查询指标列表接口,在其响应体的相关指标数据中获取。 对于OBS相关指标数据,当进行了相关OBS接口操作时可查询到相关指标数据,否则查询结果为空。 对于EVS相关指标数据,disk_name维度下,它的返回值有云服务器实例ID-盘符名和云服务器实例ID-volume-卷ID两种。 云服务器实例ID-盘符名,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-vda(vda为盘符名)。 云服务器实例ID-volume-卷ID,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-volume-31f45764-38b3-44ad-aaca-4015c83371e6。 样例: 请求样例一:查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1.0/{project_id}/metric-data?namespace=SYS.E CS &metric_name=cpu_util&dim.0=instance_id,6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d&from=1556625600000&to=1556632800000&period=1200&filter=min 请求样例二:查询CloudTable服务维度分别是cluster_id为f2fbxxxc-36b2-4d1d-895d-972a4d656xxx和instance_name为hmaster-active的监控指标cmdProcessMem,在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1.0/{project_id}/metric-data?namespace=SYS.CloudTable&metric_name=cmdProcessMem&dim.0=cluster_id,f2fbxxxc-36b2-4d1d-895d-972a4d656xxx&dim.1=instance_name,hmaster-active&from=1556625600000&to=1556632800000&period=1200&filter=variance
  • 响应消息 响应参数 表3 响应参数 名称 参数类型 说明 datapoints Array of objects 指标数据列表。详细参数请参见表4。 由于查询数据时,云监控会根据所选择的聚合粒度向前取整from参数,所以datapoints中包含的数据点有可能会多于预期。 metric_name String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表4 datapoints字段数据结构说明 名称 参数类型 说明 average Double 聚合周期内指标数据的平均值。 max Double 聚合周期内指标数据的最大值。 min Double 聚合周期内指标数据的最小值。 sum Double 聚合周期内指标数据的求和值。 variance Double 聚合周期内指标数据的方差。 timestamp Long 指标采集时间,UNIX时间戳,单位毫秒。 unit String 指标单位。 响应样例 响应样例一:维度为SYS.ECS,响应弹性云服务器,CPU使用率的平均值。 { "datapoints": [ { "average": 0.23, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" } 响应样例二:维度为SYS.ECS,响应弹性云服务器,CPU使用率的求和值。 { "datapoints": [ { "sum": 0.53, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" } 响应样例三:维度为SYS.ECS,响应弹性云服务器,CPU使用率的最大值。 { "datapoints": [ { "max": 0.13, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" }
  • 返回值 正常 201 异常 返回值 说明 400 Bad Request 请求错误。 401 Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
  • 请求消息 单次POST请求消息体大小不能超过512KB,否则请求会被服务端拒绝。 POST请求发送周期应小于最小聚合周期,否则会出现聚合数据点不连续。例如:聚合周期为5分钟,发送周期为7分钟,则5分钟情况的聚合数据会出现每10分钟才出现一个点。 POST请求体中时间戳(collect_time)的值必须从当前时间的前三天到当前时间后的十分钟之内某一时间,如果不在这个范围内,则不允许插入指标数据。 请求参数 表2 参数说明 名称 参数类型 是否必选 说明 数组元素 Array of objects 是 添加一条或多条自定义指标监控数据。 单次POST请求消息体大小不能超过512KB 详细参数请参见表3。 表3 数组元素 名称 是否必选 参数类型 说明 metric 是 Object 指标数据。 详细参数请参见表4。 ttl 是 Integer 数据的有效期,超出该有效期则自动删除该数据,单位秒,取值范围(0-604800]。 collect_time 是 Long 数据收集时间 UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-3天+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 value 是 Double 待添加的监控指标数据的值。 数值类型支持“整数”或“浮点数”。 unit 否 String 数据的单位。 最大长度为32位。 type 否 String 枚举型。 取值范围: int float 表4 metric字段数据结构说明 名称 是否必选 参数类型 说明 namespace 是 String 自定义的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32,其中service不能为“SYS”、“AGT”和“SRE”,namespace不能为SERVICE.BMS,因为此namespace已被系统使用。 当alarm_type为(EVENT.SYS| EVENT.CUSTOM)时允许为空。 dimensions 是 Array of objects 指标的维度,目前最大支持3个维度。 详细参数请参见表5。 metric_name 是 String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表5 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value 是 String 维度取值,例如弹性云服务器的ID。 必须以字母或数字开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为256。 请求样例 请求样例一:添加自定义的维度instance_id为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的监控指标数据cpu_util。 [ { "metric": { "namespace": "MINE.APP", "dimensions": [ { "name": "instance_id", "value": "6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d" } ], "metric_name": "cpu_util" }, "ttl": 172800, "collect_time": 1463598260000, "type": "float", "value": 0.09, "unit": "%" }, { "metric": { "namespace": "MINE.APP", "dimensions": [ { "name": "instance_id", "value": "6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d" } ], "metric_name": "cpu_util" }, "ttl": 172800, "collect_time": 1463598270000, "type": "float", "value": 0.12, "unit": "%" } ] 请求样例二:添加关系型数据库的维度rds_cluster_id为3c8cc15614ab46f5b8743317555e0de2in01的监控指标数据rds021_myisam_buf_usage。 [ { "metric": { "namespace": "SYS.RDS", "dimensions": [ { "name": "rds_cluster_id", "value": "3c8cc15614ab46f5b8743317555e0de2in01" } ], "metric_name": "rds021_myisam_buf_usage" }, "ttl": 172800, "collect_time": 1463598260000, "type": "float", "value": 0.01, "unit": "Ratio" } ] 请求样例三:添加分布式缓存服务的维度dcs_instance_id为1598b5d4-3cb5-4f4d-8d99-2425d8e9ed54和dcs_cluster_redis_node为6666cd76f96956469e7be39d750cc7d9的监控指标数据connections_usage。 [ { "metric": { "namespace": "SYS.DCS", "dimensions": [ { "name": "dcs_instance_id", "value": "1598b5d4-3cb5-4f4d-8d99-2425d8e9ed54" }, { "name": "dcs_cluster_redis_node", "value": "6666cd76f96956469e7be39d750cc7d9" } ], "metric_name": "connections_usage" }, "ttl": 172800, "collect_time": 1463598260000, "type": "float", "value": 8.3, "unit": "%" } ]
  • 返回值 正常 200 异常 返回值 说明 400 Bad Request 请求错误。 401 Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
  • 响应消息 响应参数 表5 响应参数 名称 参数类型 说明 metrics Arrays of objects 指标数据。 详细参数请参见表6。 表6 metrics字段数据结构说明 名称 参数类型 说明 unit String 指标单位。 datapoints Arrays of objects 指标数据列表。由于查询数据时,云监控会根据所选择的聚合粒度向前取整from参数,所以datapoints中包含的数据点有可能会多于预期,最多返回3000个数据点。 详细参数请参见表8。 namespace String 指标命名空间,格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 dimensions Arrays of objects 指标维度列表。 单个维度为json对象,结构说明如下: { "name": "instance_id", "value": "33328f02-3814-422e-b688-bfdba93d4050" } 详细参数请参见表7。 metric_name String 指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,长度最短为1,最大为64。 表7 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value String 维度取值,例如弹性云服务器的ID。 必须以字母或数字开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为256。 表8 datapoints字段数据结构说明 名称 参数类型 说明 average Double 聚合周期内指标数据的平均值。 max Double 聚合周期内指标数据的最大值。 min Double 聚合周期内指标数据的最小值。 sum Double 聚合周期内指标数据的求和值。 variance Double 聚合周期内指标数据的方差。 timestamp Long 指标采集时间,UNIX时间戳,单位毫秒。 响应样例 响应样例一:维度是instance_id为faea5b75-e390-4e2b-8733-9226a9026070的弹性云服务器的监控数据cpu_util的平均值和维度是instance_id为06b4020f-461a-4a52-84da-53fa71c2f42b的弹性云服务器的监控数据network_vm_connections的平均值。 { "metrics": [ { "namespace": "SYS.ECS", "metric_name": "cpu_util", "dimensions": [ { "name": "instance_id", "value": "faea5b75-e390-4e2b-8733-9226a9026070" } ], "datapoints": [ { "average": 0.69, "timestamp": 1556625610000 }, { "average": 0.7, "timestamp": 1556625715000 } ], "unit": "%" }, { "namespace": "SYS.ECS", "metric_name": "network_vm_connections", "dimensions": [ { "name": "instance_id", "value": "06b4020f-461a-4a52-84da-53fa71c2f42b" } ], "datapoints": [ { "average": 1, "timestamp": 1556625612000 }, { "average": 3, "timestamp": 1556625717000 } ], "unit": "count" } ] } 响应样例二:维度是rds_cluster_id为3c8cc15614ab46f5b8743317555e0de2in01的关系性数据库和维度是rds_cluster_id为3b2fa8b55a9b4adca3713962a9d31884in01的关系性数据库的监控数据rds021_myisam_buf_usage的求和值。 { "metrics": [ { "unit": "Ratio", "datapoints": [ { "sum": 0.07, "timestamp": 1556625628000 }, { "sum": 0.07, "timestamp": 1556625688000 } ], "namespace": "SYS.RDS", "dimensions": [ { "name": "rds_cluster_id", "value": "3c8cc15614ab46f5b8743317555e0de2in01" } ], "metric_name": "rds021_myisam_buf_usage" }, { "unit": "Ratio", "datapoints": [ { "sum": 0.06, "timestamp": 1556625614000 }, { "sum": 0.07, "timestamp": 1556625674000 } ], "namespace": "SYS.RDS", "dimensions": [ { "name": "rds_cluster_id", "value": "3b2fa8b55a9b4adca3713962a9d31884in01" } ], "metric_name": "rds021_myisam_buf_usage" } ] } 响应样例三:维度是instance_id为cd841102-f6b1-407d-a31f-235db796dcbb和proc为b28354b543375bfa94dabaeda722927f的主机监控的监控数据rds021_myisam_buf_usage的最小值。 { "metrics": [ { "unit": "Ratio", "datapoints": [ { "min": 0, "timestamp": 1556625612000 }, { "min": 0, "timestamp": 1556625672000 } ], "namespace": "AGT.ECS", "dimensions": [ { "name": "instance_id", "value": "cd841102-f6b1-407d-a31f-235db796dcbb" }, { "name": "proc", "value": "b28354b543375bfa94dabaeda722927f" } ], "metric_name": "rds021_myisam_buf_usage" } ] }
  • 请求消息 单次POST请求消息体大小不能超过512KB,否则请求会被服务端拒绝。 对于不同的period取值和查询的指标数量,其对应的默认最大查询区间(to - from)也不同,计算规则为“指标数量 * (to - from) / 监控周期 ≤ 3000”。 当period值为“1”时,监控周期为60*1000ms=60000ms。 当period值为"300" 时,监控周期为300*1000ms=300000ms。 当period值为"1200" 时,监控周期为1200*1000ms=1200000ms。 当period值为"3600" 时,监控周期为3600*1000ms=3600000ms。 当period值为"14400" 时,监控周期为14400*1000ms=14400000ms。 当period值为"86400" 时,监控周期为86400*1000ms=86400000ms。 例如批量查询300个指标,监控周期为60000ms,可算出(to - from)最大值为"600000",若设定的请求参数使(to - from)超出最大值,from值会自动调整为"to-600000"。 请求参数 表2 请求参数 名称 是否必选 参数类型 说明 metrics 是 Arrays of objects 指标数据。数组长度最大500。 详细参数请参见表3。 from 是 Long 查询数据起始时间,UNIX时间戳,单位毫秒。建议from的值相对于当前时间向前偏移至少1个周期。由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果将from和to的范围设置在聚合周期内,会因为聚合未完成而造成查询数据为空,所以建议from参数相对于当前时间向前偏移至少1个周期。以5分钟聚合周期为例:假设当前时间点为10:35,10:30~10:35之间的原始数据会被聚合到10:30这个点上,所以查询5分钟数据点时from参数应为10:30。 说明: 云监控会根据所选择的聚合粒度向前取整from参数。 to 是 Long 查询数据截止时间UNIX时间戳,单位毫秒。from必须小于to。 period 是 String 监控数据粒度。 枚举值,取值范围: "1",原始数据 "300",5分钟粒度 "1200",20分钟粒度 "3600",1小时粒度 "14400",4小时粒度 "86400",1天粒度 filter 是 String 数据聚合方式,支持的聚合方式如下: average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 filter参数的值不会影响原始数据(period为1)的查询结果。 表3 metrics字段数据结构说明 名称 是否必选 参数类型 说明 namespace 是 String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 metric_name 是 String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表 中的监控指标参考文档列。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为64。 dimensions 是 Arrays of objects 指标维度列表。数组最大长度为4。 单个维度为json对象,结构说明如下: { "name": "instance_id", "value": "33328f02-3814-422e-b688-bfdba93d4050" } 详细说明请参见表4。 表4 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value 是 String 维度取值,例如弹性云服务器的ID。可通过调用查询指标列表接口,在其响应体的相关指标数据中获取 必须以字母或数字开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为256。 对于dimensions字段里value的值,可通过调用查询指标列表接口,在其响应体的相关指标数据中获取。 对于OBS相关指标数据,当进行了相关OBS接口操作时可查询到相关指标数据,否则查询结果为空。 请求样例 请求样例一:查看维度是instance_id为faea5b75-e390-4e2b-8733-9226a9026070的弹性云服务器的监控数据cpu_util和维度instance_id为06b4020f-461a-4a52-84da-53fa71c2f42b的弹性云服务器的监控数据network_vm_connections,在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,原始数据的平均值。 { "metrics": [ { "namespace": "SYS.ECS", "dimensions": [ { "name": "instance_id", "value": "faea5b75-e390-4e2b-8733-9226a9026070" } ], "metric_name": "cpu_util" }, { "namespace": "SYS.ECS", "dimensions": [ { "name": "instance_id", "value": "06b4020f-461a-4a52-84da-53fa71c2f42b" } ], "metric_name": "network_vm_connections" } ], "from": 1556625600000, "to": 1556632800000, "period": "1", "filter": "average" } 请求样例二:查看维度是rds_cluster_id为3c8cc15614ab46f5b8743317555e0de2in01的关系性数据库的监控数据rds021_myisam_buf_usage和维度是rds_cluster_id为3b2fa8b55a9b4adca3713962a9d31884in01的关系性数据库的监控数据rds021_myisam_buf_usage,在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,原始数据的求和值。 { "metrics": [ { "namespace": "SYS.RDS", "dimensions": [ { "name": "rds_cluster_id", "value": "3c8cc15614ab46f5b8743317555e0de2in01" } ], "metric_name": "rds021_myisam_buf_usage" }, { "namespace": "SYS.RDS", "dimensions": [ { "name": "rds_cluster_id", "value": "3b2fa8b55a9b4adca3713962a9d31884in01" } ], "metric_name": "rds021_myisam_buf_usage" } ], "from": 1556625600000, "to": 1556632800000, "period": "1", "filter": "sum" } 请求样例三:查看维度是instance_id为cd841102-f6b1-407d-a31f-235db796dcbb和proc为b28354b543375bfa94dabaeda722927f的主机监控的监控数据proc_specified_count,在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟时,指标数据的最小值。 { "metrics": [ { "namespace": "AGT.ECS", "dimensions": [ { "name": "instance_id", "value": "cd841102-f6b1-407d-a31f-235db796dcbb" }, { "name": "proc", "value": "b28354b543375bfa94dabaeda722927" } ], "metric_name": "proc_specified_count" } ], "from": 1556625600000, "to": 1556632800000, "period": "1200", "filter": "min" }
  • Agent支持的系统有哪些? 以下列表中系统版本,是经过验证确定可以支持的系统版本,对于其余版本的支持情况,正在验证中。 以下系统都基于华为云IMS服务提供的公共镜像或者公共镜像创建的系统,如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统 版本 支持Agent安装(ECS) 支持Agent一键安装(ECS) 支持Agent安装(BMS) Windows Windows 2012 √ × √ Windows 2016 √ × √ Windows 2019 √ × √ Windows 2022 √ × √ CentOS CentOS 6.9 64bit(40GB) √ × × CentOS 6.10 64bit √ × × CentOS 7.2 64bit √ √ √ CentOS 7.3 64bit √ √ √ CentOS 7.4 64bit √ √ √ CentOS 7.5 64bit √ √ × CentOS 7.6 64bit √ √ √ CentOS 7.6 64bit(ARM) × × √ CentOS 7.7 64bit √ √ × CentOS 7.8 64bit √ √ × CentOS 7.9 64bit √ √ √ CentOS 8.0 64bit √ √ × CentOS 8.1 64bit √ √ × CentOS 8.2 64bit √ √ × CentOS Stream 8/X86版 √ × × CentOS Stream 8/ARM版 √ × × CentOS Stream 9/X86版 √ × × Alma Linux AlmaLinux 8.7 √ × × AlmaLinux 9.1 √ × × AlmaLinux 9.0 64bit √ √ × Debian Debian 9.0.0 64bit √ × × Debian 8.8.0 64bit √ × × Debian 8.2.0 64bit √ × × Debian 10.0.0 64bit √ × × Debian 10.2.0 64bit(ARM) √ × × Debain10.5 √ × × Debain10.6 √ × × Debain11.10 √ √ × debian 11.4 √ × × debian 11.5 √ × × EulerOS EulerOS 2.8 64bit × × √ EulerOS 2.5 64bit √ √ × EulerOS 2.3 64bit × × √ EulerOS 2.2 64bit √ × × EulerOS 2.8 64bit(ARM) √ × √ EulerOS 2.9 64bit √ × √ EulerOS 2.9 64bit(ARM) √ × × EulerOS 2.10 √ × √ Fedora Fedora 30 64bit √ × × Fedora 31 √ × × Fedora 36 √ × × Huawei Cloud EulerOS Huawei Cloud EulerOS 1.0 64bit √ × × Huawei Cloud EulerOS 1.1 64bit √ √ × Huawei Cloud EulerOS 2.0 64bit √ √ √ Huawei Cloud EulerOS 2.0 ARM 64bit(40GB) √ √ √ KylinOS Kylin Linux Advanced Server for Kunpeng V1 √ × × Kylin-Server-10-SP2-20210524-x86.iso √ × × Kylin-Server-10-SP2-20210524-arm.iso √ × × openEuler openEuler 20.03 64bit √ × × openEuler 20.03 LTS SP3 64bit √ × × openEuler 22.03 LTS(ARM) × × √ openEuler 22.03 LTS 64bit √ × × OpenSUSE OpenSUSE 15.0 64bit √ × × Redhat Redhat Linux Enterprise 6.9 64bit × × √ Redhat Linux Enterprise 7.4 64bit × × √ Rocky Linux Rocky Linux 8.4 64bit √ × × Rocky Linux 8.5 64bit √ × × Rocky Linux 8.6 64 bit √ × × Rocky Linux 9.0 64bit √ √ × Rocky Linux 9.1 √ × × Rocky Linux 8.7-X86 √ × × Rocky Linux 8.7-ARM √ × × Ubuntu Ubuntu 22.04 server 64bit √ √ × Ubuntu 20.04 server 64bit √ √ √ Ubuntu 18.04 server 64bit √ √ √ Ubuntu 18.04 server 64bit(ARM) × × √ Ubuntu 16.04 server 64bit √ √ √ Ubuntu 14.04 server 64bit × × √ Ubuntu 18.04.6 server 64bit √ × × UnionTechOS UnionTech OS Server 20 Euler (1000) 64bit(ARM) √ × × UnionTech OS-Server-20-1050e-amd64-UFU.iso √ × × 父主题: 主机监控
  • 常见4XX问题处理 HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1.0/{project_id}/metric-data?namespace=SYS.ECS&metric_name=cpu_util&dim.0=instance_id,6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d&from=1556625600000&to=1556632800000&period=1200&filter=min 响应参数 { "http_code": 429, "message": { "details": "Too Many Requests.", "code": "ces.0429" }, "encoded_authorization_message": null }
  • 常见4XX问题处理 HTTP状态码 400 错误码 ces.0014 可能原因 原因1:请求参数格式错误。详见下方【案例一】 原因2:必传字段没有传。详见下方【案例二】 案例一 请求参数格式错误 from、to属性对应的值应该换算为毫秒进行传参。 period属性支持的枚举值:1,300,1200,3600,14400,86400。 filter属性支持的枚举值:average,max,min,sum,variance。 请求参数 { "from": 1724331974, ##传参为秒级非毫秒级 "to": 1724315493, ##传参为秒级非毫秒级 "period": "10086", ##period属性对应的枚举值不存在10086 "filter": "standard", ##filter属性对应的枚举值不存在standard "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea69" }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "http_code": 400, "message": { "details": "Some content in message body is not correct, error message: [from, to]",##from,to属性问题 "code": "ces.0014" }, "encoded_authorization_message": null } 案例二 必传字段没有传 filter必传字段没有传,更多必传字段请查询接口文档。 请求参数 { "from": 1724119607020, "to": 1724123207020, "period": "1", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "238764d4-c4e1-4274-88a1-5956b057766b" }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "http_code": 400, "message": { "details": "Some content in message body is not correct, error message: [filter]", ##filter属性问题 "code": "ces.0014" }, "encoded_authorization_message": null } HTTP状态码 404 错误码 APIGW.0101 可能原因 原因1:路径的URI与接口文档不一致。详见下方【案例一】 案例一 路径的URI与接口文档不一致 请求路径中URI中的版本号写错,应该为V1.0非V1。正确URI为/V1.0/{project_id}/batch-query-metric-data。 请求路径 POST /V1/04f9aca88c00d3202fd4c01ed679daf0/batch-query-metric-data 响应参数 { "error_code": "APIGW.0101", "error_msg": "The API does not exist or has not been published in the environment", "request_id": "7d7a8258354300ac158c7b14a158d6ec" } HTTP状态码 401 错误码 ces.0015 可能原因 原因1:请求 IAM 获取Token中写的项目ID与调用批量查询监控数据接口接口使用的项目ID不同。 原因2:Token 过期。 原因3:Token内容复制过程少复制或多复制其他内容。 原因4:ak与sk不匹配。 定位思路 根据可能原因进行故障排查。 解决方法 原因1:请求IAM 获取Token 请求参数写的项目ID与调用批量查询监控数据接口使用的项目ID不同。 解决方法: 将获取Token请求参数中项目ID参数与调用批量查询监控数据接口使用的项目ID保存一致。 原因2:Token 过期。 解决方法: 重新生成Token。 原因3:Token内容复制过程少复制或多复制其他内容。 解决方法: 获取正确的Token。 原因4:ak与sk不匹配。 解决方法: 获取租户匹配的AK与SK。 案例 Token异常导致认证失败。 请求头 X-Auth-Token:MIIqDgYJKoZIhvcNAQcCoIIp-zCC......+6CIyAFrbHVxQZJ2Jq ##Token异常 请求参数 { "from": 1724311893283, "to": 1724315493283, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea69" }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "http_code": 401, "message": { "details": "Authenticate failed.", "code": "ces.0015" }, "encoded_authorization_message": null } HTTP状态码 403 错误码 ces.0050 可能原因 原因1:用户策略中没有ces:metricData:list细粒度权限。详见下方【案例一】 案例一 用户策略中没有ces:metricData:list细粒度权限 用户策略中没有 ces:metricData:list 细粒度权限。需要在用户所属策略中添加该action。 请求头 X-Auth-Token:MIIqDgYJKoZIhvcNAQcCoIIp-zCC......+6CIyAFrbHVxQZJ2Jq 请求参数 { "from": 1724311893283, "to": 1724315493283, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea69" }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "http_code": 403, "message": { "details": "Policy doesn't allow [ces:metricData:list] to be performed.", ##用户策略中没有 ces:metricData:list 细粒度权限 "code": "ces.0050" }, "encoded_authorization_message": null } HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 案例一 API被流控 请求API被流控。 若API被流控,需第一时间找运维人员配置新的流程策略。 请求参数 { "from": 1724311893283, "to": 1724315493283, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea69" }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "http_code": 429, "message": { "details": "Too Many Requests.", "code": "ces.0429" }, "encoded_authorization_message": null }
  • 使用前常见问题 问题一 问题描述 POST /V1.0/{project_id}/batch-query-metric-data 批量查询监控数据接口如何使用。 解决方法 请参考批量查询监控数据解决。 问题二 问题描述 POST /V1.0/{project_id}/batch-query-metric-data 批量查询监控数据接口支持的最大查询时间范围。 解决方法 支持的最大查询时间:155天。 问题三 问题描述 调用不同region区域的接口,对应的 域名 是什么。 解决方法 请参考地区和终端节点。
  • 接口调用过程中常见问题 问题一 问题描述 调用批量查询监控数据接口,响应状态码200,无指标数据返回。响应体样例如下: { "metrics": [{ "namespace": "SYS.RDS", "metric_name": "rds039_disk_util", "dimensions": [{ "name": "instance_id", "value": "5e319882ffa04c968e469035a116b2d1in04" }], "datapoints": [],##指标数据列表中没有指标数据 "unit": "unknown" }] } 可能原因 原因1:云服务对应的命名空间写错。详见下方【案例一】。 原因2:请求资源不存在。详见下方【案例二】。 原因2:维度不属于云服务。详见下方【案例三】。 原因3:指标ID不属于云服务。详见下方【案例四】。 解决方法 支持监控的服务列表中命名空间、维度、监控指标参考文档三列内容匹配。 案例一 云服务对应的命名空间写错 指标ID mem_usedPercent 对应的命名空间为AGT.ECS。 请求参数 { "from": 1724311893283, "to": 1724315493283, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea6" }], "metric_name": "mem_usedPercent", "namespace": "SYS.ECS" ##命名空间错误 }] } 响应参数 { "metrics": [{ "namespace": "SYS.ECS", "metric_name": "mem_usedPercent", "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea6" }], "datapoints": [], "unit": "unknown" }] } 案例二 请求资源不存在 资源实例 129718f5-833d-4f78-b685-6b1c3091ea7 没有在ECS云服务资源列表中。 请求参数 { "from": 1724311893283, "to": 1724315493283, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea7" ##资源实例129718f5-833d-4f78-b685-6b1c3091ea7 没在ECS云服务资源列表中 }], "metric_name": "mem_usedPercent", "namespace": "AGT.ECS" }] } 响应参数 { "metrics": [{ "namespace": "AGT.ECS", "metric_name": "mem_usedPercent", "dimensions": [{ "name": "instance_id", "value": "129718f5-833d-4f78-b685-6b1c3091ea6" }], "datapoints": [], "unit": "unknown" }] } 案例三 维度不属于云服务 instance_id维度不属于RDS云服务 请求参数: { "metrics": [{ "dimensions": [{ "name": "instance_id", ##instance_id维度不属于RDS云服务 "value": "5e319882ffa04c968e469035a116b2d1in04" }], "metric_name": "rds039_disk_util", "namespace": "SYS.RDS" }], "filter": "average", "period": "1", "from": 1724312777938, "to": 1724316377938 } 响应参数: { "metrics": [{ "namespace": "SYS.RDS", "metric_name": "rds039_disk_util", "dimensions": [{ "name": "instance_id", "value": "5e319882ffa04c968e469035a116b2d1in04" }], "datapoints": [], "unit": "unknown" }] } 案例四 指标ID不属于云服务 rds958_disk_util指标ID不属于RDS云服务。 请求参数: { "metrics": [{ "dimensions": [{ "name": "rds_cluster_sqlserver_id", "value": "5e319882ffa04c968e469035a116b2d1in04" }], "metric_name": "rds958_disk_util", ##rds958_disk_util指标ID不属于RDS云服务 "namespace": "SYS.RDS" }], "filter": "average", "period": "1", "from": 1724312777938, "to": 1724316377938 } 响应参数: { "metrics": [{ "namespace": "SYS.RDS", "metric_name": "rds958_disk_util", "dimensions": [{ "name": "rds_cluster_sqlserver_id", "value": "5e319882ffa04c968e469035a116b2d1in04" }], "datapoints": [], "unit": "unknown" }] } 问题二 问题描述 调用批量查询监控数据接口,查询弹性云服务器中操作系统监控的磁盘使用率,响应状态码200,无指标数据返回。响应体样例如下: { "metrics": [{ "namespace": "AGT.ECS", "metric_name": "disk_usedPercent", "dimensions": [{ "name": "disk", "value": "012bec14bc176310c19f40e384fd629b" }, { "name": "instance_id", "value": "07d878a9-2243-4e84-aeef-c47747d18024" }], "datapoints": [], ##指标数据列表中没有指标数据 "unit": "unknown" }] } 可能原因 原因1:命名空间错误。详见下方【案例一】 原因2:指标对应的维度错误。详见下方【案例二】 原因3:ECS实例未安装agent插件。详见下方【案例三】 原因4:ECS实例安装的agent插件没有上报磁盘使用率指标数据。详见下方【案例四】 案例一 命名空间错误 命名空间错误。若查询的是弹性云服务器中操作系统监控指标,命名空间需为AGT.ECS。 请求参数: { "from": 1724118017498, "to": 1724121617498, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "07d878a9-2243-4e84-aeef-c47747d18024" }, { "name": "mount_point", "value": "012bec14bc176310c19f40e384fd629b" }], "metric_name": "disk_usedPercent", "namespace": "SYS.ECS" ##命名空间错误 }] } 响应参数: { "metrics": [{ "namespace": "SYS.ECS", "metric_name": "disk_usedPercent", "dimensions": [{ "name": "mount_point", "value": "012bec14bc176310c19f40e384fd629b" }, { "name": "instance_id", "value": "07d878a9-2243-4e84-aeef-c47747d18024" }], "datapoints": [], "unit": "unknown" }] } 案例二 指标对应的维度错误 磁盘使用率是挂载点维度,对于磁盘使用率查询在请求参数中需要写两个维度,维度一为云服务实例instance_id,维度二为挂载点mount_point。 请求参数: { "from": 1724118017498, "to": 1724121617498, "period": "1", "filter": "average", "metrics": [{ "dimensions": [{ "name": "instance_id", "value": "07d878a9-2243-4e84-aeef-c47747d18024" }, { "name": "disk", ##指标对应的维度错误 "value": "012bec14bc176310c19f40e384fd629b" }], "metric_name": "disk_usedPercent", "namespace": "AGT.ECS" }] } 响应参数: { "metrics": [{ "namespace": "AGT.ECS", "metric_name": "disk_usedPercent", "dimensions": [{ "name": "disk", "value": "012bec14bc176310c19f40e384fd629b" }, { "name": "instance_id", "value": "07d878a9-2243-4e84-aeef-c47747d18024" }], "datapoints": [], "unit": "unknown" }] } 案例三 ECS实例未安装agent插件 在 CES 页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 agent插件故障导致没有上报指标数据,详见agent常见问题排查。 问题二 问题描述 指定时间范围内上报的指标数据量大于3000,但调用批量查询监控数据接口,返回的指标数据量小于3000。 可能原因 对于不同的period取值和查询的指标数量,其对应的默认最大查询区间(to - from)也不同,计算规则为“指标数量 * (to - from) / 监控周期 ≤ 3000”。 指标数量:请求参数metrics属性对应元素的个数。 监控周期:请求参数period属性对应的值,单位默认为分钟,需转化为毫秒。 3000:响应体中的所有datapoints(指标数据列表)总和。 原因1:若上报指标周期小于批量查询监控数据的监控周期,会将监控周期内上报的多条指标数据按照聚合规则聚合成一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。 解决方法 将请求参数监控周期按照接口文档给出的枚举值选择小点的监控周期。 使用查询监控数据接口查询指标数据(仅支持单指标查询),该接口对返回的指标数据量无限制操作。 问题二 问题描述 调用批量查询监控数据接口,返回的指标数据点时间远大于请求参数from对应的值。 可能原因 对于不同的period取值和查询的指标数量,其对应的默认最大查询区间(to - from)也不同,计算规则为“指标数量 * (to - from) / 监控周期 ≤ 3000”。 指标数量:请求参数metrics属性对应元素的个数。 监控周期:请求参数period属性对应的值,单位默认为分钟,需转化为毫秒。 3000:响应体中的所有datapoints(指标数据列表)总和。 例如批量查询300个指标,监控周期为60000ms,可算出(to - from)最大值为"600000",若设定的请求参数(to - from)超出最大值,from值会自动调整为"to-600000" 原因1: 根据以上公式可知指标数量过多。详见下方【案例一】 原因2: 根据以上公式可知监控周期过小。详见下方【案例一】 解决方法 原因1:指标数量过多。 解决方法:减少指标数量。 使用查询监控数据接口查询指标数据(仅支持单指标查询)。 原因2:选择的监控周期对应的枚举值小。 解决方法: 将请求参数监控周期按照接口文档给出的枚举值选择大点的监控周期。 案例一 指标数量过多,监控周期过小 若请求参数指标数量为300个,监控周期为1min对应60000ms,根据以上公式可算出(to - from)最大值为"600000"。请求参数to-from=1724742027556-1724738427556=3600000,超出了600000,from值会自动调整为"to-600000"即1724742027556-600000=1724741427556。 接口在指定时间范围内返回指标数据点最早的时间为2024-08-27 14:51:27,但查询的开始时间为2024-08-27 14:00:27。 请求参数 { "metrics": [ { "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vda" } ], "metric_name": "disk_device_read_bytes_rate", "namespace": "SYS.EVS" }, { "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vdc" } ], "metric_name": "disk_device_read_bytes_rate", "namespace": "SYS.EVS" }, { "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vda" } ], "metric_name": "disk_device_write_bytes_rate", "namespace": "SYS.EVS" }, { "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vdc" } ], "metric_name": "disk_device_write_bytes_rate", "namespace": "SYS.EVS" }, ...... { "dimensions": [ { "name": "nat_gateway_id", "value": "3c55363f-6416-45ca-8512-cf1f6f2533e7" } ], "metric_name": "inbound_pps", "namespace": "SYS.NAT" } ], "filter": "max", "period": "1", "from": 1724738427556, ##2024-08-27 14:00:27 "to": 1724742027556 ##2024-08-27 15:00:27 } 响应参数 { "metrics": [ { "namespace": "SYS.EVS", "metric_name": "disk_device_read_bytes_rate", "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vda" } ], "datapoints": [ { "max": 0, "timestamp": 1724741487000 ##2024-08-27 14:51:27 }, { "max": 0, "timestamp": 1724741547000 ##2024-08-27 14:52:27 }, { "max": 0, "timestamp": 1724741607000 }, { "max": 0, "timestamp": 1724741667000 }, { "max": 0, "timestamp": 1724741727000 }, ...... ], "unit": "B/s" }, { "namespace": "SYS.EVS", "metric_name": "disk_device_read_bytes_rate", "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vdc" } ], "datapoints": [ { "max": 0, "timestamp": 1724741487000 }, { "max": 0, "timestamp": 1724741547000 }, { "max": 0, "timestamp": 1724741607000 }, { "max": 0, "timestamp": 1724741667000 }, { "max": 0, "timestamp": 1724741727000 }, ...... ], "unit": "B/s" }, { "namespace": "SYS.EVS", "metric_name": "disk_device_write_bytes_rate", "dimensions": [ { "name": "disk_name", "value": "6a2bf14a-e3be-4fc9-8522-ba6fe7f0b503-vda" } ], "datapoints": [ { "max": 3055.1, "timestamp": 1724741487000 }, { "max": 3195.78, "timestamp": 1724741547000 }, { "max": 2973.39, "timestamp": 1724741607000 }, { "max": 3533.52, "timestamp": 1724741667000 }, { "max": 2636.8, "timestamp": 1724741727000 }, ....... ], "unit": "B/s" }, ...... ] }
  • 监控指标 表1 站点监控指标说明 指标ID 监控指标 说明 round_trip_time 响应时间 响应时间指站点对用户的请求做出的反应时间,即探测点和站点建立连接完成到探测点收到响应消息第一个字节的时间。 单位:毫秒。 availability 可用性 可用性指标以小时为周期进行统计,开通监控后,1小时后可查看可用性监控图表。 可用性 =(每小时探测的总次数 - 每小时返回异常状态次数)/ 每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:2xx代表成功处理请求,3xx代表请求被重定向,4xx代表请求错误等。 probe_point_success_count 可用探测点数量 该指标用于统计正常状态探测点的个数。 probe_point_success_rate 可用探测点百分比 该指标用于统计可用探测点的百分比。 可用探测点百分比 = 正常状态的探测点个数 / 所有探测点个数 * 100% 响应时间、可用性、可用探测点数量、可用探测点百分比适用于HTTP(S)、TCP、UDP、PING探测协议,丢包率仅适用于PING探测协议,HTTP响应码仅适用于HTTP(S)探测协议。 后续会支持POP3、SMTP、DNS、FTP等标准网络协议的互联网服务可用性。
  • 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 首期支持华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)五个探测点实时监控网站,后续探测点和能力不再演进,如有诉求请使用广域网质量监控,具体操作请参见广域网质量监控(公测)。 目前站点监控功能免费。 站点监控部署在华北-北京一,若子账号无权限,需在用户所在用户组策略中勾选添加华北-北京一的权限。 图1 修改CES授权范围